banner

ブログ

May 28, 2023

機械学習の説明

良い雇用システムに不可欠な 4 つの選択肢

生成 AI には人間の創造的なタッチが必要な理由

ブルーボトルコーヒーのCEOがオーツミルクとイノベーションについて語る

クレジット: アンドリュー・オヌフリエンコ/ゲッティイメージズ

重要なアイデア

人工知能

による

サラ・ブラウン

2021年4月21日

この広く普及した強力な形式の人工知能は、あらゆる業界を変えています。 機械学習の可能性と限界、および機械学習の使用方法について知っておくべきことは次のとおりです。

機械学習は、チャットボットや予測テキスト、言語翻訳アプリ、Netflix が提案する番組、ソーシャル メディア フィードの表示方法の背後にあります。 画像に基づいて病状を診断できる自動運転車や機械に電力を供給します。

今日、企業が人工知能プログラムを導入する際には、機械学習を使用している可能性が高く、そのため、この用語はしばしば同じ意味で使用され、場合によっては曖昧に使用されます。 機械学習は、明示的にプログラムされずにコンピューターに学習能力を与える人工知能のサブ分野です。

「わずかここ5~10年で、機械学習は重要な方法となり、おそらく最も重要な方法となり、AIのほとんどの部分が完成しました」とMIT集団知性センターの創設ディレクターであるMITスローン教授のトーマス・W・マローン氏は述べた。 。 「だからこそ、一部の人々は AI と機械学習という用語をほぼ同義語として使用しています…現在の AI の進歩のほとんどには機械学習が関係しています。」

機械学習の普及が進むにつれ、ビジネスに携わるすべての人が機械学習に遭遇する可能性が高く、この分野に関する実用的な知識が必要になります。 2020 年の Deloitte の調査では、67% の企業が機械学習を使用しており、97% が機械学習を使用しているか、来年中に使用する予定であることがわかりました。

製造業から小売業、銀行業、パン屋に至るまで、伝統的な企業でさえも機械学習を利用して新たな価値を引き出したり、効率を高めたりしています。 「機械学習はあらゆる業界で変化しつつある、あるいは今後も変化するだろう。リーダーは基本原則、可能性、限界を理解する必要がある」と、MIT コンピューターサイエンス教授で MIT 導入可能な機械学習センターの所長であるアレクサンダー・マドリー氏は述べた。

誰もが技術的な詳細を知る必要があるわけではありませんが、その技術が何をするのか、何ができて何ができないのかを理解する必要があるとマドリー氏は付け加えました。 「何が起こっているのか、誰も気づかないわけにはいかないと思います。」

これには、機械学習の社会的、社会的、倫理的な影響を認識することが含まれます。 「これらのツールを利用し、理解し始めることが重要です。そして、それらをどのようにうまく活用するかを考えることが重要です。私たちは、これらのツールを全員の利益のために使用しなければなりません」と、2016 年 MBA のジョアン・ラロベレ博士は述べました。 、小児心臓集中治療医であり、非営利団体The Virtue Foundationの共同創設者です。 「AI には良いことを行う可能性がたくさんあります。このことについて考えるとき、私たちはそのことをしっかりと念頭に置いておく必要があります。これをどのように利用して、良いことを行い、世界をより良くすることができるでしょうか?」

機械学習は人工知能のサブ分野であり、人間の知的行動を模倣する機械の機能として広義に定義されます。 人工知能システムは、人間が問題を解決する方法と同様の方法で複雑なタスクを実行するために使用されます。

CSAIL の主席研究員であり InfoLab グループの責任者であるボリス・カッツ氏によると、AI の目標は、人間と同じように「知的な行動」を示すコンピューター モデルを作成することです。 これは、視覚的なシーンを認識したり、自然言語で書かれたテキストを理解したり、物理世界でアクションを実行したりできるマシンを意味します。

機械学習は AI の活用方法の 1 つです。 1950 年代に AI の先駆者アーサー サミュエルによって「明示的にプログラムされずにコンピューターに学習能力を与える研究分野」と定義されました。

MIT Sloan の講師であり、金融​​および米国の情報コミュニティ向けの人工知能を専門とする Kensho の機械学習責任者である Mikey Shulman 氏によると、この定義は当てはまります。 同氏は、コンピューターをプログラミングする従来の方法、つまり「ソフトウェア 1.0」をパン作りに例えました。レシピでは正確な量の材料が要求され、正確な時間だけ混ぜるようパン屋に指示されます。 従来のプログラミングでも同様に、コンピューターが従うべき詳細な命令を作成する必要があります。

しかし、場合によっては、さまざまな人物の写真を認識するようにコンピューターをトレーニングするなど、機械が従うプログラムの作成に時間がかかる、または不可能なことがあります。 人間はこの作業を簡単に実行できますが、コンピュータにその実行方法を指示するのは困難です。 機械学習は、コンピューターに経験を通じて自らのプログラミングを学習させるというアプローチを採用しています。

機械学習は、銀行取引、人物やパン製品の写真、修理記録、センサーからの時系列データ、販売レポートなどの数値、写真、テキストなどのデータから始まります。 データは収集され、トレーニング データまたは機械学習モデルのトレーニングに使用される情報として使用できるように準備されます。 データが多ければ多いほど、プログラムはより優れたものになります。

そこから、プログラマーは使用する機械学習モデルを選択し、データを提供して、コンピューター モデルにパターンを見つけたり予測を行ったりするように自動的にトレーニングさせます。 時間の経過とともに、人間のプログラマがパラメータの変更などモデルを微調整して、モデルをより正確な結果に近づけることもできます。 (研究科学者のジャネール・シェーンの Web サイト「AI Weirdness」では、機械学習アルゴリズムがどのように学習するのか、また、アルゴリズムがレシピを生成しようとしてチョコレート チキン チキン ケーキを作成したときに起こったように、どのようにして問題が発生するのかについて興味深い考察が行われています。)

一部のデータはトレーニング データから抽出され、評価データとして使用されます。これは、新しいデータが表示されたときに機械学習モデルがどの程度正確であるかをテストします。 その結果、将来的にさまざまなデータセットで使用できるモデルが得られます。

マローン氏は、MIT教授でCSAIL所長のダニエラ・ラス氏とMIT集団知性センター副所長のロバート・ラウバッカー氏の共著で、AIと仕事の未来に関する最近の研究概要の中で、成功した機械学習アルゴリズムはさまざまなことができると書いている。 。

「機械学習システムの機能は次のとおりです。説明的なつまり、システムは何が起こったのかを説明するためにデータを使用します。予測的なつまり、システムはデータを使用して何が起こるかを予測します。 または規範的なつまり、システムはデータを使用して、どのようなアクションをとるべきかについて提案を行うことになります」と研究者らは書いている。

機械学習には 3 つのサブカテゴリがあります。

監督あり機械学習モデルはラベル付きデータセットを使用してトレーニングされるため、モデルは時間の経過とともにより正確に学習し、成長することができます。 たとえば、人間がラベルを付けた犬などの写真を使ってアルゴリズムをトレーニングすると、機械が犬の写真を独自に識別する方法を学習します。 教師あり機械学習は、現在使用されている最も一般的なタイプです。

監督されない機械学習では、プログラムはラベルのないデータ内のパターンを探します。 教師なし機械学習は、人々が明示的に探していないパターンや傾向を見つけることができます。 たとえば、教師なし機械学習プログラムは、オンライン販売データを調べて、購入を行っているさまざまなタイプの顧客を識別できます。

強化機械学習は、報酬システムを確立することで、試行錯誤を通じて機械を訓練し、最適なアクションを実行します。 強化学習では、いつ正しい決定を下したかを機械に伝えることで、ゲームをプレイするモデルを訓練したり、自動運転車を訓練したりすることができ、時間の経過とともにどのような行動を取るべきかを学習するのに役立ちます。

出典: トーマス・マローン | MITスローン。 参照: https://bit.ly/3gvRho2、図 2。

マローン氏は、Work of the Futureの概要で、機械学習は大量のデータ、つまり顧客との以前の会話の録音、機械からのセンサーログ、ATM取引などの数千、数百万の例を扱う状況に最適であると述べた。 たとえば、Google 翻訳が可能になったのは、ウェブ上のさまざまな言語の膨大な情報を「トレーニング」したからです。

マドリー氏によると、場合によっては、機械学習によって洞察が得られたり、人間では不可能な意思決定が自動化されたりする可能性があるという。 「アルゴリズムにこれを実行させる方が効率的でコストがかからないだけでなく、文字通り人間には実行できない場合もあります」と同氏は述べた。

Google検索は人間ができることの一例だが、人がクエリを入力するたびにGoogleモデルが潜在的な答えを表示できるほどの規模と速度では決して実現できないとマローン氏は述べた。 「これは、コンピュータが人々を失業させる例ではありません。人間がやらなければ経済的に不可能だったであろうことを、コンピュータが実行した例です。」

機械学習は、他のいくつかの人工知能サブフィールドにも関連付けられています。

自然言語処理

自然言語処理は、コンピューターのプログラムに通常使用されるデータや数値ではなく、人間が話したり書いたりする自然言語を機械が理解することを学習する機械学習の分野です。 これにより、機械は言語を認識し、理解し、応答するだけでなく、新しいテキストを作成したり、言語間で翻訳したりすることができます。 自然言語処理により、チャットボットや Siri や Alexa などのデジタル アシスタントなどの使い慣れたテクノロジーが可能になります。

ニューラルネットワーク

ニューラル ネットワークは、一般的に使用される機械学習アルゴリズムの特定のクラスです。 人工ニューラル ネットワークは人間の脳をモデルにしており、数千または数百万の処理ノードが相互接続され、層に編成されています。

人工ニューラル ネットワークでは、セルまたはノードが接続され、各セルが入力を処理し、他のニューロンに送信される出力を生成します。 ラベル付きデータはノードまたはセル内を移動し、各セルは異なる機能を実行します。 写真に猫が含まれているかどうかを識別するようにトレーニングされたニューラル ネットワークでは、さまざまなノードが情報を評価し、写真に猫が写っているかどうかを示す出力に到達します。

ディープラーニング

深層学習ネットワークは、多くの層を持つニューラル ネットワークです。 階層化されたネットワークは大量のデータを処理し、ネットワーク内の各リンクの「重み」を決定できます。たとえば、画像認識システムでは、ニューラル ネットワークの一部の層が目、鼻、顔などの顔の個々の特徴を検出する可能性があります。一方、別のレイヤーは、それらの特徴が顔を示す方法で現れるかどうかを判断できます。

ニューラル ネットワークと同様に、ディープ ラーニングは人間の脳の仕組みに基づいてモデル化されており、自動運転車、チャットボット、医療診断などの多くの機械学習の用途を強化します。

「レイヤーが多ければ多いほど、複雑なことをうまく実行できる可能性が高まります」とマローン氏は言う。

ディープラーニングには大量のコンピューティング能力が必要であるため、その経済的および環境的な持続可能性について懸念が生じます。

機械学習は、Netflix の提案アルゴリズムや Google の検索エンジンの場合のように、一部の企業のビジネス モデルの中核です。 他の企業も機械学習に深く取り組んでいますが、それは彼らの主要なビジネス提案ではありません。

最近の調査によると、企業の 67% が機械学習を使用しています。

機械学習を有益な方法で使用する方法をまだ模索している人もいます。 「私の考えでは、機械学習で最も難しい問題の 1 つは、機械学習でどのような問題を解決できるかを理解することです」とシュルマン氏は言います。 「理解にはまだギャップがあります。」

MIT Initiative on the Digital Economyの研究者らは2018年の論文で、タスクが機械学習に適しているかどうかを判断するための21の質問のルーブリックを概説した。 研究者らは、機械学習の影響を受けない職業はないが、完全に機械学習に引き継がれる可能性が低い職業はないことを発見した。 研究者らは、機械学習を成功に導く方法は、ジョブを個別のタスクに再編成することであり、その一部は機械学習で実行でき、その他は人間が必要であることを発見しました。

企業はすでに次のようなさまざまな方法で機械学習を使用しています。

レコメンデーションアルゴリズム。 Netflix や YouTube の提案、Facebook フィードに表示される情報、製品の推奨の背後にある推奨エンジンは、機械学習によって強化されています。 「(アルゴリズムは)私たちの好みを学習しようとしている」とマドリー氏は語った。 「彼らは、Twitter 上で私たちがどのようなツイートを見せてほしいのか、Facebook 上でどのような広告を表示すべきなのか、どのような投稿やいいねされたコンテンツを私たちと共有してほしいのかを知りたがっているのです。」

画像解析と物体検出。機械学習は、画像を分析してさまざまな情報を得ることができます。たとえば、人を識別して区別する方法を学習できますが、顔認識アルゴリズムには議論の余地があります。 ビジネスでの用途はさまざまです。 シュルマン氏は、ヘッジファンドが機械学習を利用して駐車場の車の台数を分析していることは有名で、これは企業の業績を把握し、適切な賭けをするのに役立っていると指摘した。

不正行為の検出 。 機械は、誰かが通常どのように支出するか、通常どこで買い物をするかなどのパターンを分析して、不正の可能性のあるクレジット カード取引、ログイン試行、またはスパム メールを特定できます。

自動ヘルプラインまたはチャットボット。多くの企業がオンライン チャットボットを導入しています。このチャットボットでは、顧客やクライアントは人間と話すのではなく、機械と対話します。 これらのアルゴリズムでは機械学習と自然言語処理が使用されており、ボットは過去の会話の記録から学習して適切な応答を考え出します。

自動運転車。自動運転車の背後にあるテクノロジーの多くは、機械学習、特にディープラーニングに基づいています。

医療画像と診断。機械学習プログラムは、マンモグラムに基づいてがんのリスクを予測できるツールなど、医療画像やその他の情報を調べて病気の特定のマーカーを探すようにトレーニングできます。

レポートを読む: 人工知能と仕事の未来

機械学習は、従業員を支援したり、ビジネスに新たな可能性をもたらしたりするテクノロジーを推進していますが、ビジネス リーダーが機械学習とその限界について知っておくべきことがいくつかあります。

説明可能性

懸念される領域の 1 つは、一部の専門家が説明可能性と呼ぶもの、つまり機械学習モデルが何を行っているのか、どのように意思決定を行っているのかを明確にする能力です。 「なぜモデルがそのような動作をするのかを理解することは、実際には非常に難しい質問であり、常に自問しなければなりません」とマドリー氏は語った。 「これを決してブラックボックスとして扱ってはなりません。それはただの神託です…はい、それを使用する必要があります。しかし、その後、それが導き出した経験則が何であるかを感じてみてください。そして、それらを検証してください。」 」

システムはだまされて機能を損なったり、人間でも簡単に実行できる特定のタスクで失敗したりする可能性があるため、これは特に重要です。 たとえば、画像内のメタデータを調整するとコンピューターが混乱する可能性があります。いくつかの調整を行うと、機械は犬の写真をダチョウとして識別します。

マドリー氏は、X線を検査する機械学習アルゴリズムが医師よりも優れていると思われる別の例を指摘した。 しかし、アルゴリズムは必ずしも画像自体ではなく、画像を撮影したマシンと結果を関連付けていたことが判明しました。 結核は、古い機械を使用する傾向がある発展途上国でより一般的です。 機械学習プログラムは、X 線撮影が古い機械で行われた場合、患者が結核に罹患する可能性が高いことを学習しました。 タスクは完了しましたが、プログラマーが意図した、または役立つと思われる方法ではありませんでした。

モデルがどのように機能するのか、そしてその精度を説明することの重要性は、モデルがどのように使用されるかによって変わる可能性がある、とシュルマン氏は語った。 適切に設定された問題のほとんどは機械学習によって解決できますが、現時点ではモデルが人間の精度の約 95% までしか機能しないと人々は想定すべきだと同氏は述べました。 映画を推奨するアルゴリズムが 95% 正確であれば、プログラマーと視聴者にとっては問題ないかもしれませんが、自動運転車や機械の重大な欠陥を見つけるように設計されたプログラムには、そのレベルの精度では十分ではありません。

偏見と意図しない結果

機械は人間によって訓練され、人間の偏見をアルゴリズムに組み込むことができます。偏った情報や既存の不平等を反映するデータが機械学習プログラムに供給されると、プログラムはそれを再現し、差別を永続させる方法を学習します。 たとえば、人々が Twitter でどのように会話するかについて訓練されたチャットボットは、攻撃的で人種差別的な言葉を感知する可能性があります。

場合によっては、機械学習モデルが社会問題を引き起こしたり、悪化させたりすることがあります。 たとえば、Facebook は、ユーザーに興味を持って引き付ける広告やコンテンツを表示するツールとして機械学習を使用しています。これにより、人々が扇動的で党派的なものを見せられると、二極化や陰謀論の拡散につながる極端なコンテンツを表示するモデルが生まれました。 、または不正確なコンテンツ。

機械学習のバイアスと戦う方法には、トレーニング データを慎重に精査し、倫理的な人工知能の取り組みを組織的に支援することなどがあります。これには、組織が人間中心の AI を採用していることを確認することや、さまざまな背景、経験、ライフスタイルを持つ人々からの意見を求める習慣が含まれます。 AIシステムの設計。 この問題に取り組む取り組みには、アルゴリズム ジャスティス リーグやモラル マシン プロジェクトなどがあります。

シュルマン氏は、経営陣は機械学習が実際に自社にどのような価値をもたらすのかを理解するのに苦労する傾向があると述べた。 ある企業にとって厄介なものは、別の企業にとっては中核となるものであり、企業はトレンドを避け、自社に適したビジネス ユースケースを見つける必要があります。

シュルマン氏は、アマゾンでの機械学習の仕組みはおそらく自動車会社には応用できないだろうと述べた。アマゾンは音声アシスタントや音声操作スピーカーで成功を収めているが、それは自動車会社が車にスピーカーを追加することを優先すべきという意味ではない。 同氏によると、おそらく自動車会社は工場ラインで機械学習を利用し、多額の費用を節約したり、多額の利益を得る方法を見つけるかもしれないという。

「この分野は非常に急速に進んでおり、それは素晴らしいことだが、経営陣がそれについて意思決定をし、どれだけのリソースを投入するかを決定することが困難になっている」とシュルマン氏は語った。

また、問題を探す際の解決策として機械学習を検討することも避けた方がよいとシュルマン氏は言います。 企業によっては、機械学習をビジネス用途にバックポートしようとすることになるかもしれません。 企業はテクノロジーに焦点を当てることから始めるのではなく、機械学習で満たせるビジネス上の問題や顧客のニーズに焦点を当てることから始める必要があります。

ラロヴェア氏は、機械学習の基本的な理解は重要だが、機械学習の適切な用途を見つけるには、最終的には異なる専門知識を持つ人々が協力することにかかっています、と述べました。 「私はデータ サイエンティストではありません。実際のデータ エンジニアリング作業 (機械学習アプリケーションを可能にするためのすべてのデータの取得、処理、ラングリングなど) を行っているわけではありませんが、これらのチームと協力して、私たちが必要とする答えが得られ、必要な影響を与えることができます」と彼女は言いました。 「本当にチームで働かなければなりません。」

ビジネスにおける機械学習コースにサインアップします。

MIT OpenCourseWare による機械学習の概要をご覧ください。

AI の先駆者が、企業が機械学習を使用して変革できるとどのように考えているかをお読みください。

機械学習の進歩と限界について、2 人の AI 専門家とのディスカッションをご覧ください。

機械学習の 7 つのステップを見てみましょう。

次を読む: 機械学習プロジェクトを成功させるための 7 つの教訓

機械学習とは何ですか? 記述的予測 規範的 教師あり 教師なし 強化 自然言語処理 ニューラル ネットワーク 深層学習 企業による機械学習の使用方法 推奨アルゴリズム。 画像解析と物体検出。 不正行為の検出 自動ヘルプラインまたはチャットボット。 自動運転車。 医療画像と診断。 機械学習の仕組み: 約束と課題 説明可能性 バイアスと意図しない結果 機械学習を機能させる アレクサンダー・マドリーの記事 重要なアイデアを実現するためのアイデア 重要なアイデアを実現するアイデア
共有