2023年03月06日19時10分 / 提供:マイナビニュース
ChatGPTの成功に後押しされてAIの進化に注目が集まる中、Microsoftの研究チームが「Kosmos-1」と名付けられた新たなAIモデルを発表した。Kosmos-1は、自然言語だけでなく視覚的なコンテンツも認識し、画像と文章を組み合わせた質問にも回答することができるAIモデルで、Microsoftの研究チームはこれを「マルチモーダル大規模言語モデル(MLLM: Multimodal Large Language Model)」と呼んでいる。
Kosmos-1を利用すれば、これまでのLLMで可能だった自然言語の認識や文章生成に加えて、OCRを使わない文字認識や、画像のキャプションの生成、画像に関連した質問への回答などがAIによって行えるようになるという。
[ 続きを読む ]