Appleが開発 スマホに特化したマルチモーダルLLM『Ferret UI』

「スマホ画面上のオブジェクトを理解するの...
Read More

OCR

JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。
GoogleがLLMで「非構造化文書」高精度テキスト抽出するOCR『LMDX』発表
数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』
Apple、3万文字の「手書き漢字」認識するAI技術を開発(論文)【AI×社会】
世界の言葉はデジタル保存されていく。ウルドゥー語編(AI×都市)【論文】
インクの質感までAI生成できるか。新鋭”DocCreator”(AI×OCR)【論文】
すべての言語はデジタル化できるのか。難読言語のOCRが開発中(AI×アート)【論文】
動画中から”難関”アラビア語の抽出なるか(AI×エンタメ)【論文】

業界/カテゴリー

PAGE TOP