Appleが開発 スマホに特化したマルチモーダルLLM『Ferret UI』

「スマホ画面上のオブジェクトを理解するの...
Read More

時系列分析におけるLLMの可能性について

Microsoftなどの研究者らは、LL...
Read More

ChatGPTと実際に交わされた会話の世界最大規模データセット「WildChat」

コーネル大学などの研究者らは、ChatG...
Read More

LLMは制御工学でどれほど能力があるか Claude 3、GPT-4、Gemini Ultraでの実験結果

イリノイ大学など複数機関の研究グループが...
Read More

LLMによりクエリを生成するアプローチで情報検索の精度を上げる方法

LLMを用いて対話型の情報検索システムに...
Read More

投稿者の過去記事

視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
プロンプトの原則26ヶ条をまとめた報告
LLMのRAG(外部知識検索による強化)をまとめた調査報告
Gemini Pro 対 GPT-4V、画像認識能力でどちらが優秀なのか
消費者向けGPUでも高性能GPUに近いパフォーマンスでLLMを動かす手法「PowerInfer」
OpenAIが開発中の「人間を超えたAIを制御する」方法
Tencentの研究者らが、人間のようにタップやスワイプでスマホアプリを操作するAIエージェント『AppAgent』を開発したと報告しています。
あらゆるLLMを「使い心地」基準でバトルさせる便利なプラットフォーム『Chatbot Arena:チャットボットアリーナ』

業界/カテゴリー

PAGE TOP