お問い合わせはこちら

業界/カテゴリー

おすすめ企画

日本ディープラーニング協会

LLMが「自然言語で記述されたアルゴリズムを実行する」能力で非常に高い性能を示す

今回研究者らは、自然言語で記述されたアル...
Read More

Claude 3の能力における詳細な評価結果

Anthropicは新しい大規模マルチモ...
Read More

人はディベートで人よりもGPT-4が相手のとき81.7%高い確率で意見を変える(つまり討論に負ける)傾向にあったとの実験報告
RAGにおいてLLMが「役立たない情報を無視」できるようにする『RAFT』QAタスクで従来の手法を大幅に上回る結果を達成
Microsoftなどのプロンプト圧縮技術『LLMLingua-“2″』タスクの精度を維持したまま圧縮率2-5倍
Googleなど、API経由でブラックボックスLLMの隠れ次元数を特定できる脆弱性を示す ※OpenAI社はこれを受け対策済み
GPT-4などのLLMがセキュリティ脆弱性とソフトウェア機能性の評価能力で高い精度を示す
LLMが「自然言語で記述されたアルゴリズムを実行する」能力で非常に高い性能を示す
GoogleのGeminiファミリー最新モデル「Gemini 1.5 Pro」1000万トークンでほぼ完璧な検索性能
LLMの記号推論タスク(化学式や絵文字の理解など)で記号を自然言語に変換することの有効性を確認
「Pandasデータフレームの欠損値を確認せよ! 」AIクイズ実装編【第7問】
「配列をpandasデータフレームにせよ! 」AIクイズ実装編【第6問】
「モデル作成後の評価法は? 」AIクイズ実装編【第5問】
「scikit-learnで最小二乗法! 」AIクイズ実装編【第4問】
「pandasでcsvファイルを読み取る! 」AIクイズ実装編【第3問】
「numpy配列の行数と列数を取得せよ! 」AIクイズ実装編【第2問】
「データを訓練データとテストデータに分割せよ! 」AIクイズ実装編【第1問】
「クラスタリングの評価手法『ARIやNMI』の欠点は? 」AIクイズscikit-learn編【第5問】
「DBCANの正しい説明とは? 」AIクイズscikit-learn編【第4問】
「凝集型クラスタリングとは? 」AIクイズscikit-learn編【第3問】
「t-SNEは何次元のデータを可視化できる? 」AIクイズscikit-learn編【第2問】
「非負値行列因子分解(NMF)とは? 」AIクイズscikit-learn編【第1問】
「ディープラーニングの応用分野はどれ? 」AIクイズ応用編【第30問】
「Pythonのグラフ描画ライブラリはどれ?」AIクイズ応用編【第29問】
「ニューラルネットワークの学習の流れ、分かる?」AIクイズ応用編【第28問】
人はディベートで人よりもGPT-4が相手のとき81.7%高い確率で意見を変える(つまり討論に負ける)傾向にあったとの実験報告
RAGにおいてLLMが「役立たない情報を無視」できるようにする『RAFT』QAタスクで従来の手法を大幅に上回る結果を達成
Microsoftなどのプロンプト圧縮技術『LLMLingua-“2″』タスクの精度を維持したまま圧縮率2-5倍
Googleなど、API経由でブラックボックスLLMの隠れ次元数を特定できる脆弱性を示す ※OpenAI社はこれを受け対策済み
GPT-4などのLLMがセキュリティ脆弱性とソフトウェア機能性の評価能力で高い精度を示す
LLMが「自然言語で記述されたアルゴリズムを実行する」能力で非常に高い性能を示す
GoogleのGeminiファミリー最新モデル「Gemini 1.5 Pro」1000万トークンでほぼ完璧な検索性能
LLMの記号推論タスク(化学式や絵文字の理解など)で記号を自然言語に変換することの有効性を確認
Claude 3の能力における詳細な評価結果
GPT-4Vで画像分析する際、画像に「ドットマトリックス」を重ねるだけで認識精度が大きく向上
表とテキストを両方含むドキュメントからLLMで上手に情報抽出を行う手法
LLMは本当に推論しているか?原理から導かれる長所短所と最適なフレームワーク
検索結果をLLMでチェックして自動的に再検索する『MetaRAG』出力精度を大幅に向上
スクショからHTMLとCSSのコードをLLMが生成する『Design2Code』タスク、プロンプト手法やファインチューニングで高い性能を確認
「シリコンの群衆」LLM集団(12体)は人間にどれほど近づくか
人間の集団が持つアイデアはAIによって多様性が向上することが研究で示唆されています。
数学オリンピックの金メダリストと似たレベルで幾何学問題を解くAIシステムをDeepMindが開発したことがNatureで報告されています。
JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。
視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
ChatGPTなど提供のOpenAI元CEOが代表に復帰
ChatGPTなど運営OpenAI社のCEOが交代
オセロで「完璧な手を打ち続けた結果は引き分けである」ことを証明する研究が発表されました。
現時点でのLLMに対する網羅的な評価分析が行われました。
LLMと遺伝的アルゴリズムを使用して、個性によって社会集団の行動がどのように変化していくのかを観察する挑戦的な研究が行われました。
特定の個人の好みやニーズに最も適したレスポンスや行動を行うLLMを開発する手法、『Personalized Soups(意訳:ぼくだけのためのスープ)』が開発されました。
「DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか?」に対するOpenAIの論文が発表されました。
電気回路図などの図表をテキストのみから生み出すLLM駆動のフレームワーク『DiagrammerGPT(ダイアグラマーGPT)』が登場しました。
GPT-4との対話でタスクプランニングを行うロボットシステムフレームワークが発明されました。
GPT-4などLLMのコード生成能力にデバッグ機能を追加する『SELF-DEBUGGING(セルフデバッギング)』フレームワークが考案されました。
LLMがソフトウェアエンジリアリングにおいて現時点で役に立つこと&課題。Metaなどの研究者らが報告
主要な世界的AI研究機関(企業)が自社の論文を掲載しているWebページまとめ
AIによる「電力予測」どこまで進んでる?研究事例まとめ
「投資」にAIを活用した研究事例まとめ【解説あり】
「農業」や「畜産」にAIを活用した研究事例まとめ【解説あり】
「食品の品質管理」にAIを活用した研究事例まとめ【解説付き】
「学会レポート」特集!記事一覧
「AI研究者が語る」特集!記事一覧
「AI時代のメンタリズム」特集!記事一覧
「AI×釣り」特集!記事一覧
「AIアプリやってみた」特集!記事一覧
「StyleGAN」特集!記事一覧
「G検定・E資格」特集!
「東大生AI初心者じゅんぺーの学習日誌」特集!記事一覧

お問い合わせはこちら

業界/カテゴリー

おすすめ企画

日本ディープラーニング協会

PAGE TOP