論文 | AIDB - Part 3

ホーム
過去の記事一覧

コンテンツ検索

プロンプトでLLMにRPAワークフローを自動生成させる手法「FlowMind」JPモルガン考案

By AIDB Research / 2024/04/23

LLMとユーザーフィードバックを巧みに組...

LLMにおける、長いコンテキストから欲しい情報を見つけ出す「needle-in-a-haystack（干し草の中の針）」テスト結果とプロンプト例

By AIDB Research / 2024/04/22

LLMがプロンプト内の情報をどの程度正確...

プロンプトに例を多く載せるほど、どんなタスクでも性能が上がるのか？DeepMindによる『Many-shot Learning』の実験結果

By AIDB Research / 2024/04/19

プロンプトに例示を含めることにより新しい...

Appleが開発　スマホに特化したマルチモーダルLLM『Ferret UI』

By AIDB Research / 2024/04/18

「スマホ画面上のオブジェクトを理解するの...

LLMが思考のネットワークを構築し、人間の推論プロセスを模倣する『THOUGHTSCULPT』プロンプティング

By AIDB Research / 2024/04/17

UCバークレーの研究者たちは、LLMがよ...

ChatGPTは学術論文の文章スタイルをどう変えているか？大規模な調査の結果

By AIDB Research / 2024/04/16

今回研究者らは、ChatGPTが学術論文...

どのLLMが最も長文要約性能が高いのか評価した実験結果　データセットと要約ノウハウも公開

By AIDB Research / 2024/04/15

LLMは現在、技術的には10万トークン（...

Claude 3などのLLMはコンテキスト内学習によって線形回帰・非線形回帰問題タスクもこなす

By AIDB Research / 2024/04/12

GPT-4やClaude 3といった最先...

時系列分析におけるLLMの可能性について

By AIDB Research / 2024/04/11

Microsoftなどの研究者らは、LL...

ChatGPTと実際に交わされた会話の世界最大規模データセット「WildChat」

By AIDB Research / 2024/04/10

コーネル大学などの研究者らは、ChatG...

2024/4/1
LLM エージェント論文

LLMが生成した長いテキストにおける「事実性」を自動で評価するLLMエージェントフレームワーク『SAFE』Google DeepMindが開発

2024/3/29
LLM RAG 論文

RAG（検索拡張生成）において約半分のトークン数でタスクを実行できるフレームワーク『FIT-RAG』

2024/3/28
LLM エージェントエンタメ・アート論文

「ゲームでのLLM」における調査結果　プレイヤー・NPC・ゲームマスターなど様々な役割を網羅的に整理

2024/3/27
LLM 論文

人はディベートで人よりもGPT-4が相手のとき81.7%高い確率で意見を変える（つまり討論に負ける）傾向にあったとの実験報告

2024/3/26
LLM RAG 論文

AIDB

コンテンツ検索

プロンプトでLLMにRPAワークフローを自動生成させる手法「FlowMind」JPモルガン考案

LLMにおける、長いコンテキストから欲しい情報を見つけ出す「needle-in-a-haystack（干し草の中の針）」テスト結果とプロンプト例

プロンプトに例を多く載せるほど、どんなタスクでも性能が上がるのか？DeepMindによる『Many-shot Learning』の実験結果

Appleが開発　スマホに特化したマルチモーダルLLM『Ferret UI』

LLMが思考のネットワークを構築し、人間の推論プロセスを模倣する『THOUGHTSCULPT』プロンプティング

ChatGPTは学術論文の文章スタイルをどう変えているか？大規模な調査の結果

どのLLMが最も長文要約性能が高いのか評価した実験結果　データセットと要約ノウハウも公開

Claude 3などのLLMはコンテキスト内学習によって線形回帰・非線形回帰問題タスクもこなす

時系列分析におけるLLMの可能性について

ChatGPTと実際に交わされた会話の世界最大規模データセット「WildChat」

論文

LLMが生成した長いテキストにおける「事実性」を自動で評価するLLMエージェントフレームワーク『SAFE』Google DeepMindが開発

RAG（検索拡張生成）において約半分のトークン数でタスクを実行できるフレームワーク『FIT-RAG』

「ゲームでのLLM」における調査結果　プレイヤー・NPC・ゲームマスターなど様々な役割を網羅的に整理

人はディベートで人よりもGPT-4が相手のとき81.7%高い確率で意見を変える（つまり討論に負ける）傾向にあったとの実験報告

RAGにおいてLLMが「役立たない情報を無視」できるようにする『RAFT』QAタスクで従来の手法を大幅に上回る結果を達成

Microsoftなどのプロンプト圧縮技術『LLMLingua-“2″』タスクの精度を維持したまま圧縮率2-5倍

Googleなど、API経由でブラックボックスLLMの隠れ次元数を特定できる脆弱性を示す　※OpenAI社はこれを受け対策済み

GPT-4などのLLMがセキュリティ脆弱性とソフトウェア機能性の評価能力で高い精度を示す

コンテンツ検索

業界／カテゴリー

おすすめポスト

コンテンツ検索

論文

コンテンツ検索

業界／カテゴリー

直近1か月で読まれている記事

おすすめポスト