北のシュガポン

北海道大学の工学部生。電気・情報・ロボット・エネルギー専攻。 札幌で一人暮らし満喫中。 お菓子作り、プログラミング、機械学習と色々なことに手を出している暇人。

北大生がつぶやく大学生活や勉強や趣味のブログ。昼頃更新。

機械学習とは何ぞや概論

シュガポンです。

 

1年くらい前から機械学習やら最適化やらを勉強してまして、この場を使いまして少し概論的なことを書こうかなーと。

 

 

機械学習って何ぞや

まずはここからですね。

機械学習って要は、「人間がやるようなことを機械にもやらせようぜ!」的なノリだと思っています。はい。

 

これだけじゃ適当すぎるので、もう少し話すと・・・

機械学習やらAI(人工知能)が発達するまで、何かしらのパターンや関係性を見つけること、

もっと言えば単純な公式・定理によらない物事の評価や、機械の設計なんかも、全て人間がやっていました。

そりゃそうですよね。だって、コンピューターにできることはせいぜい計算やデータベースの検索くらいでしたから。そこらへんは機械が不得手とする分野だったわけです。

 

しかし、時代が進むにつれ、計算機(コンピューター)の性能が向上し、また機械学習の理論ができ始めると、

・データの列からある種のパターンを見つけること

・画像の中から特定の物体だけを取り出すこと

・モーターなどの形状設計をあるアルゴリズムを使って機械が行うこと

なんかを計算機で行うことができそうだ、ってことになりまして。

それが現在の機械学習やAIの分野に発達していきました。

・・・って感じだと思います(想像)。

 

身近な例を挙げると、Googleの画像検索でしょうか。

あれ、別に裏に人間が居てせっせこ画像の分類をしているわけではなく、機械学習の理論を用いて類似する画像を引っ張ってきている、らしいですよ。

 

あとはショッピングサイトなんかでよくあるレコメンド機能("あなたへのおすすめ"機能)とかも機械学習の一種ですね。ユーザーの購入履歴から、ごちゃごちゃ行列計算をして列ベクトルを取り出すことでユーザーへのおすすめをはじき出しています。中身は数学の計算です。

 

 

ビッグデータって?

機械学習を語るにあたって外せない存在がビッグデータですね。

何のことはない、ただの大量のデータのことです。びっぐなでーたですから。

 

じゃあなんでこれが注目されている(されていた?)かというと・・・

AI(機械学習)の性能がデータの多さによって決まるから、です。一言で言えば(めちゃくちゃ語弊はありますが)。

 

機械「学習」というくらいですから、まあ学習しているわけです。コンピューターが。詳細は省きますが、ある程度の性能をコンピューターに発揮させるにはデータ数が肝心なのです。

人間もそうですよね。色んなものを見て、学習する。

我々は「猫」が「猫」であるということを、個々の猫をたくさん見て、そこから「共通部分」を取り出して抽象化することで認識しているわけです。

猫をたくさん見ることで、「猫ってこんな感じの造形だよな~」「種類たくさんいるけど、大抵しっぽが長くて耳が立ってるよな~」っていうことを無意識に学んでいるわけです。

 

コンピューターも同じ。多くのデータを与えられて初めて学習が可能になります。

ですからビッグデータが必要。こういう論理なわけです。

まあ、人間と違って、コンピューターにはデータの形式やら何やらがありますので、データを適切な形に変換して与える必要があります。面倒ですが。

 

 

機械学習も万能ではないが・・・

ここまで機械学習とは何ぞやという点をお話しました。

 

ところで、巷では「2045年にはシンギュラリティがやってくる」と囁かれていますね。シンギュラリティって?要は、「機械が人間を超える日」です。インディペンデンスデイ的な。

 

近年のAIの進化は目覚ましく、様々な分野にAIないしロボットが進出しようとしています。

このペースで進化していけば、人間の仕事の大半が機械に取って代わられてしまうのではないか・・・。というお話です。

 

とはいえ、私はこの考えには懐疑的です。

もちろん可能性としてはあります。近年のAIの発展は超スピードで、この先どうなるかなんて予想できませんから。

 

ですが、現状、人間の仕事の大半を機械が奪う、ということには中々ならないんじゃないかな~って思ってます。

理由は3つ。

・現状、機械学習の際には人間が適切な設定をしてやる必要がある。また、アルゴリズムによっては、実現不可能な結果を出力することもあり、(結果が適切かどうか)人間が監視している必要がある。

・変化や新しい事項への対応力が乏しい。先に述べたように、機械学習でできるのはあくまで「今までのデータを用いた予測」に過ぎず、データの無い新たな事項に対しては学習結果が役に立たない。

・停電時の脆弱性。

 

勿論、いずれにせよこれからの研究で覆される可能性は十分にあります。ハイパーパラメータ(人間が適切に設定してやる必要のある数値)を機械学習のプロセスから除外しよう、なんて研究も色々あると思います。

 

ですが、個人的にはそれ以上に、

「これ以上発展しなくてもいいんじゃないかな~(小声)」って気持ちはどこかにあります。

機械学習とかの研究してるのに矛盾してますね。

 

少なくとも、AIの発展に伴い、新たな法体系が必要になることは火を見るよりも明らかです。自動運転の事故なんかは良い例だと思います。

これをちゃんとしなければ、いわゆるディストピアが実現してしまうのでは・・・という懸念はあります。9割9分杞憂・・・だといいんですけどね。

 

 

 

ちょっと色々書きすぎましたが、要は、

・「機械学習」=「機械に色々勉強させること」

・機械学習にはビッグデータが必要

・2045年のシンギュラリティは来るか?

といった感じです。ではでは。

 

----------------------------------

今日の英単語

singularity

名詞:特異性、単一

 

シンギュラリティ。元々はこんな感じの意味です。「singular」(単一の)という形容詞の名詞形ですね。一個しかないから、特異的、みたいな。

本文で触れた「(技術的)シンギュラリティ」以外にも、「シンギュラリティ生物学」なる分野があるそうです。今朝初めて知りました。

----------------------------------