マインクラフトを上手にプレイするAI『JARVIS-1』登場

北京大学やカリフォルニア大学などの研究者...
Read More

プロンプトを調整しないLLMのプロンプトエンジニアリング新手法『ControlPE』

これまでのLLMの使用法は、モデルの動き...
Read More

LLMは「色」の概念をどれほど理解しているか

楽天、産総研、東京大学の研究者チームは、...
Read More

画像認識

画像分析機能を持つオープンソースLLM『LLaVA-1.5』登場。手持ちの画像を分析可能。GPT-4Vとの違い
「1枚絵の3D化」が非常に手軽な操作で実行できる軽快なツール『DreamGaussian』とWebでの使い方
OpenAI、ChatGPTが画像を分析する『GPT-4V(ビジョン)』を発表。安全性、嗜好性、福祉機能を強化
数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』
ロボットが「初めて見る環境」で「初めて聞く指示」に対しても行動をとれるようにする
未知の物体を認識し、それを既知の物体と区別する新たな研究 BMWやGoogleなど
SAMを利用した新たな異常検知フレームワーク「SAA+」の紹介
なんでも追跡、ビデオセグメンテーション技術「TAM」登場 論文から解説

業界/カテゴリー

PAGE TOP