Android加入詮釋更具情緒張力的字幕功能、更直覺的掃碼傳檔方式,讓Gemini與更多服務整合
Google針對Android作業系統釋出多項以人工智慧技術推動的便利功能,包含可詮釋更豐富情緒、更具張力的字幕內容,以及藉由Gemini 1.5 Pro人工智慧模型強化Lookout App的影像描述能力,同時也讓Gemini人工智慧技術與更多第三方App整合,甚至可以記住個人喜好及習慣,另外也讓檔案內容傳輸、交換變得更簡單。
可詮釋更豐富情緒、更具張力的字幕功能中,將透過人工智慧分析播放影片內容,藉此分析影片中所呈現情緒張力,進而在透過字幕呈現其表達字句,更可透過文字描述其當下情緒或動作,例如「呻吟」、「低語」或「急促」等形容,進而讓聽障者可以更容易藉由字幕理解影片中人物當下情緒感受。
而針對Lookout App更新部分,則是透過串接Gemini 1.5 Pro人工智慧模型,使其產生即時影像描述可以更為準確,藉此協助盲人或視障者更容易以此判斷前方景象,甚至可以透過更自然聲音詮釋描述內容。
另外,Google也開始將Gemini人工智慧技術開始整合在Spotify等第三方應用服務,另外也將與Google Maps等Google自有服務,以及與Google帳號連結的智慧家庭設備有更深入互動。
至於新版Gemini也開始加入記憶使用者個人偏好、習慣的功能,例如記住使用者不喜歡吃什麼,或是偏好觀看哪些內容,進而在後續推薦互動避免推薦使用者不喜歡吃的食物,並且依照偏好電影內容推薦合適影片,無須在每次互動時重複說明。
對於Android平台上的檔案交換需求,此次更新也增加可讓使用者透過在手機端產生QR Code,讓對方在掃描之後即可進行檔案、文件、照片或影片內容傳輸,使用者無須將對方設置為聯絡人,或是改變個人檔案分享方式。
在Google Drive更新部分,則可針對上傳照片自動調整對比、白平衡,並且透過人工智慧方式移除文件掃描時產生陰影,或是進行模糊修正等。
此次功能更新將優先針對Pixel系列機種提供,但可能要一段時間才會陸續開放所有用戶升級。
更多Mashdigi.com報導:
UL Solutions在3DMark儲存測試項目加入微軟DirectStorage功能效率評分,確認SSD相應表現