Google年度開發者大會Google I/O,在台灣時間5月15日凌晨1點登場!
在大會中,Google對其大型語言模型Gemini系列的其中幾款模型進行了更新,包括全新的Gemini 1.5 Flash以及升級版Gemini 1.5 Pro,而目前這兩款語言模型已經在超過200個國家或地區推出公開預覽版,其中包括歐洲經濟區(以及歐盟)、英國和瑞士。
Gemini 1.5 Flash
Gemini 1.5 Flash是Gemini模型系列中最新的模型,也是在API裡速度最快的Gemini模型,其可針對大規模、高頻率的任務進行最佳化,藉此降低服務成本,並提供大幅擴展的脈絡長度及長文本處理能力。
Gemini 1.5 Flash的特色在於擅長做摘要、聊天應用、提供圖說和影片字幕、從長篇文件和表格擷取資料等工作,雖然比Gemini 1.5 Pro輕量,但在處理龐大資訊量時具備非常強大的多模態推理能力。
Gemini 1.5 Pro
升級版Gemini 1.5 Pro將脈絡長度擴展到200萬個詞元,並透過資料及演算法的強化,提升了其在程式碼生成、邏輯推理和規劃、多輪對話、理解音訊和圖像方面的能力。
除此之外,Gemini 1.5 Pro現在更能理解越來越複雜且具有細微差異性的指令,像是角色、格式和風格等指定產品層次的指示,並且可針對特定的用途來改進對於模型回應的控制。
此外,Google還在Gemini API和Google AI Studio加入理解音訊的功能,所以Gemini 1.5 Pro可以對上傳至Google AI Studio的影片進行跨音訊和圖像的推理。
(以上圖片取自Google Blog)