メッチョテック📈

テクノロジー事業へ向けたOutputブログ (たまにabc!?)

【テック投資】大規模言語モデルLLMを、理解しよう!

テクノロジー事業の為の、Outputブログ。
おはようございます🌞 メッチョテック📈です。

 

 


今回は、


【テック投資】大規模言語モデルLLMを、理解しよう!

 

大規模言語モデルLLM

 


自然言語処理機械学習ディープラーニングの違い (おさらい)』

 


まずは、「自然言語処理」「機械学習」「ディープラーニング」の違いをおさらい。

 


-------
AI・人工知能機械学習自然言語処理
-------

 


機械学習」や「自然言語処理」は、『AI・人工知能』を実現する為の技術の1つ。

 

 

AI・人工知能 (人間の様な知性を持ったコンピュータの事。)
       機械学習 (AI・人工知能を実現させる為の技術の1つ。)
                ディープラーニング (機械学習の手法の1つ。画像識別が得意。)
                自然言語処理 (機械学習の手法の1つ。文字理解が得意。)
                         大規模言語モデル (自然言語処理から発展。より巨大で最新。)

 

 

このようなイメージ。

 

 

AI・人工知能…人間と同等かそれ以上の知性を持ったCP。AIの正確な定義はない。
機械学習…コンピューターに問題を学習させて、問題に潜むパターンを見つけ出す人工知能技術の1つ。
ディープラーニング機械学習の1つの手法。大量の画像をCPに投入。最適解をCP自身が導き出す。
自然言語処理…機械が人間の言葉を理解する為に用いられる人工知能技術の1つ。
大規模言語モデル自然言語処理の発展形。用いるデータ量、パラメータ数等がより巨大なもの。

 

 

『各技術の具体的な活用事例 (製品等) 』

 


自然言語処理活用例」…文字理解・音声認識等の分野に多く用いられる

Google検索
・LINE
・アレクサ
・チャットボット
・PC、スマホ等のかな文字変換

 

line.me

 

www.amazon.co.jp

 

アレクサ.1

 

 

機械学習の活用事例」…データ分析・データ予測等の分野に多く用いられる

・商品のレコメンド (ECサイト等)
・売上や需要の予測 (企業経営)
・自動運転のプログラム (自動車)
CTスキャン画像を学習させ病気の診断 (医療)
・株、為替の取引をロボットトレーダーが行う (金融)
・顔認証システム (セキュリティ)

 

 

www.tryeting.jp

 

 

ディープラーニングの活用事例」…画像認識・動画認識等の分野に多く用いられる

・物体認識 (自動運転、工場内ロボット等)
・異常検知、不良品検出 (医療診断等)
・顔認証 (セキュリティ分野等)
・文字の画像認識 (翻訳、郵便区分機等)
・画像キャプション生成 (画像から説明文を生成)

 

 

ainow.ai

 

「大規模言語モデルの活用事例」…文字理解等の分野に多く用いられる

・BERT (2018年 Google)
・Chat GPT4 (2023年 Open AI)
・LLaMA (2023年 Meta)
・LaMDA (2021年 Google)
・NEMO LLM (2022年 NVIDIA)


※大規模言語モデルはあくまで自然言語処理の発展形。

 

それぞれ得意分野が違って、特色がわかりやすいですね😆!!

 

 

aisuite.jp

 

 

詳しくは下記メッチョブログで。

 

自然言語処理

handoutai.hatenablog.com


機械学習ディープラーニングhandoutai.hatenablog.com

 

 

 


『大規模言語モデル

 


ここからが、今回の主役『大規模言語モデル』の詳細🧐

 


大規模言語モデルのLLMは、英語で...
LLM(Large Language Models)

 

 

ここは英語の略語、そのまんま...💦

 


大規模言語モデルは、自然言語処理と比べて...

 


・計算量…コンピュータが処理する仕事量
・データ量…コンピュータに入力した文章、画像等の情報量
・パラメータ数…ディープラーニングの際の確率計算を行う為の係数の大きさ

 


の3つの要素を大幅に増やす事に成功。
こうして構築された言語モデルが大規模言語モデル


大規模言語モデルは、要は自然言語処理の発展形。

 


「大規模言語モデルは...」

●人間に近い流暢な会話が可能。
自然言語処理を用いた様々な処理を超高性能に行う事が可能。

 

 

blogs.nvidia.co.jp

 

 

 

言語モデルとは...!?」


言語モデル


            は 55%          猫 27%     で 75%
            が 16%          犬 13%     の 15%         ある 87%     
吾輩    を 12%          人 60%      と 10%         ない 13%
            明るい 9%         
            嬉しい 8%

 

より自然な文章の並びに対して、

 


高い確率で文章として成立するものには「高い%」
低い確率でしか文章として成立しないものには「低い%」       ...を割り当てる。

 

 

 

 


言語モデルは、古い歴史があり...
2018年Googleディープラーニングを用いた言語モデル『BERT』を発表。

Googleの発表後、『BERT』を応用した言語モデルが多数出現。


・BERT (2018年 Google)
・Chat GPT4 (2023年 Open AI)
・LLaMA (2023年 Meta)
・LaMDA (2021年 Google)
・NEMO LLM (2022年 NVIDIA)


特にChat GPT4 (2023年 Open AI)は、
Outputの精度が極めて高く、自然言語での応答の質を大幅に高めた。

 

大規模言語モデルは、従来の自然言語処理が得意としていた...


Google検索
・LINE
・アレクサ
・チャットボット
・PC、スマホ等のかな文字変換


等の自然言語処理を用いたタスクへの応用が期待されている。


※あくまで大規模言語モデル自然言語処理の発展形。

 


『大規模言語モデルの課題点 (2024年)』


「hallucination (幻覚)」
偽の情報を平然と出力する。


「Prompt Injection」
悪質なプロンプトを用いて本来禁止されている機能を解除。

不適切な回答を得ようとする。

 

この様な課題があり、これらの解決の為の研究も行われているそう。

 


『sora』 Open AI

www.youtube.com

 


Open AIは2024年2月に動画版生成AI『sora』を発表。
上記の様な問題点の解決も進んでいそうですね🤔!!

 

 


【メッチョ所見】

自然言語処理機械学習ディープラーニングの下地があったので、今回は意外とすんなり理解出来ました。


大規模言語モデルはあくまでも自然言語処理の発展形ですが、今のテクノロジーやAI・人工知能機械学習ディープラーニングとの掛け合わせ・応用で大きく発展していきそう。今流行りの生成AI分野も近未来の序章!?と少なからず思わせます。色々な問題点を解決して、上手くビジネス活用してほしいですね!!自分はアンチ等の犯罪行為・妨害行為に気をつけながら、テック投資とabc(間近企画)のスキルを上げていきます✊!

 

 

#SBG系 #テック投資
#半導体 #経営経済 #AI・AGI
#ESG強化 #NAVディスカウント解消

 


Watch it on YouTube
メッチョテック📈 元競馬系YouTuber 

www.youtube.com