Google 正推動 Project Jarvis 代理服務,能識別截圖內容並預先準備互動,預計 12 月開放預覽 迎戰 Anthropic 的 Computer Use。
在持續推動Gemini人工智慧服務之際,The Information網站取得消息指稱,Google計畫推出以「Project Jarvis」為稱的代理 (agent)服務,或許將與Anthropic近期提出的「Computer Use」功能競爭。
依照知情人士透露說法,以「Project Jarvis」為稱的代理服務,將能藉由識別裝置螢幕上的截圖內容,在使用者進行下一步操作之前即可做好互動反應的準備。「Project Jarvis」的名稱,預期就是從《鋼鐵人》劇情中的人工智慧服務「Jarvis」衍生。
而此功能預計最快會在今年12月開放預覽,但現階段主要是與Chrome在內的網頁瀏覽器配合使用,主要能對應內容研究、購物、航班預訂等操作,同時預期會併入成為Gemini應用功能之一。
在此之前,Google已經在Pixel 9系列手機推出獨佔功能Pixel Screenshots,可幫忙記住手機截圖內容背後待辦事項,其中藉由Gemini人工智慧技術識別使用者存放在手機內的截圖內容,並且自動紀錄相關元數據資料,例如截圖何時產生、使用哪一款App等,同時也會自動產生截圖說明與相關細節摘要,甚至可依照截圖內容提供合適處理建議,例如在特定日期轉帳給指定對象。
此次傳出的「Project Jarvis」,似乎會以Pixel Screenshots功能背後相關技術,結合Gemini人工智慧模型加快識別使用者當前操作行為,並且在使用者實際做出下一步操作之前給予合適建議,或是以更快速度執行使用者所需操作。
目前Google已經讓Gemini對應更多語言介面,同時也將Gemini人工智慧功能整合至Google Meet、Google Photos、Gmail等常見服務,讓使用者能藉由人工智慧加快各類服務使用效率。
暂无评论内容