ภาพรวมและมุมมองต่อ Google I/O 2025:
- "ดีที่สุดในรอบหลายปี"
- "จุดเปลี่ยน" จากผู้ตามสู่ผู้นำ AI
เรือธง AI Chat ตามทันและแซงหน้าคู่แข่ง:
- Gemini ที่มีศักยภาพสูง: Gemini ที่เคยถูกมองว่ายังมีความสามารถจำกัดในอดีต ในงานนี้ได้แสดงให้เห็นถึงการพัฒนาอย่างก้าวกระโดด สามารถทำสิ่งที่คู่แข่งทำได้ทั้งหมดแล้ว
- ฟีเจอร์เด่น:Gemini Live: ฟีเจอร์ "เปิดกล้องส่องโลก" ที่ให้ AI สามารถตีความและตอบสนองต่อสิ่งที่เห็นผ่านกล้องได้ เปิดให้ใช้งานฟรีสำหรับทุกคน
- Project Mariner: ความสามารถในการสั่งงานผ่านหน้าเว็บ (agentic) ซึ่งมีอยู่ใน Project Mariner แล้ว
- Canvas: เครื่องมือสำหรับวาดและสร้างสรรค์เนื้อหาร่วมกัน
- ความได้เปรียบเรื่องราคา: "ที่สำคัญคือ Gemini Live มันฟรีแบบไม่ต้อง subscribe ใดๆ ฟรีทุกคนแบบไร้เงื่อนไข เหตุผลก็เพราะว่ากูเกิลรวยมากจนทำแบบนี้ได้ (แล้วใครมันจะไปสู้ได้)" การเปิดให้ใช้งานฟรีนี้ถือเป็นจุดแข็งที่คู่แข่งรายอื่นยากที่จะเลียนแบบ
โมเดล LLM: เก่งที่สุด x ถูกที่สุด:
- Gemini 2.5 Pro ขึ้นแท่นอันดับ 1: ในช่วงปี 2025 นี้ Gemini 2.5 Pro สามารถขึ้นมาครองอันดับ 1 ในการวัดประสิทธิภาพ (benchmark) ต่างๆ ได้สำเร็จ แสดงให้เห็นว่า Google มีศักยภาพในการสร้างโมเดลระดับแชมป์ได้แล้ว
- Gemini 2.5 Flash: Workhorse Model: นอกจากโมเดลที่เก่งที่สุดแล้ว Google ยังมี Gemini 2.5 Flash ที่เน้นความเร็ว ราคาถูก และใช้ token น้อยลง เหมาะสำหรับงานทั่วไป โดยโมเดลนี้ได้รับการอัปเดตอย่างต่อเนื่องจนขึ้นมาติดอันดับ 2 รองจาก Gemini 2.5 Pro
- Price/Performance ที่เหนือกว่า: "สิ่งที่เซอร์ไพร์สมากที่สุดใน I/O รอบนี้คือ Gemini 2.5 Flash มันถูกลงอีก เพราะใช้ token น้อยลงครับ ถ้าถามว่าภาพไหนที่สำคัญที่สุดใน I/O รอบนี้ ผมยกให้เป็นภาพ Pareto Frontier ที่แสดงวิธีคิดของกูเกิลในการสร้างโมเดล สังเกตว่าโมเดลของกูเกิล ซึ่งอยู่บนเส้นสีฟ้าในภาพ จะเป็นโมเดลที่อยู่ขวาบนสุดของตลาด ซึ่งหมายความว่า price/performance ดีที่สุดในตลาดนั่นเอง" แนวคิดการพัฒนาโมเดลของ Google ที่แสดงในภาพ Pareto Frontier แสดงให้เห็นถึงการให้ความสำคัญกับประสิทธิภาพต่อราคา ทำให้โมเดลของ Google มีความได้เปรียบในตลาดอย่างมาก
- ผลกระทบต่อคู่แข่ง: "ตลาดโมเดล LLM ตอนนี้น่าจะอยู่ในระดับที่ "โมเดลอะไรก็ให้ผลลัพธ์พอๆ กัน" สำหรับงานส่วนใหญ่แล้ว ผมเพิ่งฟัง startup รายหนึ่งมานำเสนอผลิตภัณฑ์ ซึ่งเขาระบุว่าเลือกใช้ Gemini ด้วยเหตุผลนี้เลย คือ ความสามารถพอๆ กัน แต่ราคาถูกกว่ากันมาก ซึ่งอันนี้น่ากลัวมากสำหรับคู่แข่ง" การที่โมเดลของ Google มีความสามารถใกล้เคียงกับคู่แข่งแต่มีราคาที่ถูกกว่าอย่างมาก ถือเป็นภัยคุกคามสำคัญต่อผู้เล่นรายอื่นในตลาด
โมเดลประเภทอื่นก็จัดเต็ม:
- ครบวงจรด้าน Multimodal: นอกจากโมเดลภาษา Google ยังเปิดตัวโมเดลสร้างภาพ (Imagen 4), วิดีโอ (Veo 3) และเพลง (Lyria 2) เวอร์ชันใหม่ โดย Veo 3 มีความสามารถในการสร้างเสียงประกอบวิดีโอได้แล้ว
- เครื่องมือสร้างหนังด้วย AI: การเปิดตัว Flow ซึ่งเป็นเครื่องมืออำนวยความสะดวกในการสร้างหนังด้วย AI โดยใช้โมเดลต่างๆ ข้างต้น แสดงให้เห็นถึงการนำเทคโนโลยี AI ไปประยุกต์ใช้ในงานสร้างสรรค์ระดับสูง
Personalization จากข้อมูลที่มีอยู่แล้ว:
- ความได้เปรียบจากข้อมูลมหาศาล: Google มีข้อมูลของผู้ใช้จากบริการต่างๆ เช่น Search, YouTube, Gmail, Photos จำนวนมหาศาล ทำให้สามารถปรับแต่งบริการ AI ให้ตรงกับความต้องการส่วนบุคคลได้โดยไม่ต้องให้ AI เรียนรู้ใหม่ทั้งหมด
- ตัวอย่างการใช้งาน: การใช้ Gemini อ่านอีเมลและเอกสารเก่าเพื่อสรุปแผนการเดินทาง หรือการใช้ Gemini เขียนอีเมลแทนในภาษาของผู้ใช้เอง
- Smart Reply ใน Gmail: การต่อยอด Personalized ไปสู่ฟีเจอร์ Smart Reply ที่มีความชาญฉลาดและตรงกับสไตล์การเขียนของผู้ใช้มากขึ้น
อนาคตของ Search กับ AI Mode:
- การปรับตัวต่อการเปลี่ยนแปลง: Google ได้เปิดตัว AI Mode ใน Google Search เพื่อตอบสนองต่อแนวโน้มที่ผู้ใช้เริ่มย้ายไปใช้บริการ AI Chat หรือ Search แบบใหม่ เช่น ChatGPT หรือ Perplexity
- AI Mode เหมือน Perplexity: ผู้เขียนอธิบายว่า AI Mode คือการเปลี่ยน interface หลักของ Google Search ให้มีลักษณะคล้ายกับ Perplexity
- ผลกระทบต่อวงการ SEO และรายได้: Google ทราบดีว่าการนำ AI มาแทนที่ Web Search แบบเดิมจะส่งผลกระทบอย่างรุนแรงต่ออุตสาหกรรมเว็บและรายได้จากโฆษณา แต่การแข่งขันที่รุนแรงทำให้ Google ไม่มีทางเลือกอื่นนอกจากต้องปรับตัว