Happy Tech Blog

ภาพรวมและมุมมองต่อ Google I/O 202


Listen Later

ภาพรวมและมุมมองต่อ Google I/O 2025:

  • "ดีที่สุดในรอบหลายปี"
  • "จุดเปลี่ยน" จากผู้ตามสู่ผู้นำ AI

เรือธง AI Chat ตามทันและแซงหน้าคู่แข่ง:

  • Gemini ที่มีศักยภาพสูง: Gemini ที่เคยถูกมองว่ายังมีความสามารถจำกัดในอดีต ในงานนี้ได้แสดงให้เห็นถึงการพัฒนาอย่างก้าวกระโดด สามารถทำสิ่งที่คู่แข่งทำได้ทั้งหมดแล้ว
  • ฟีเจอร์เด่น:Gemini Live: ฟีเจอร์ "เปิดกล้องส่องโลก" ที่ให้ AI สามารถตีความและตอบสนองต่อสิ่งที่เห็นผ่านกล้องได้ เปิดให้ใช้งานฟรีสำหรับทุกคน
  • Project Mariner: ความสามารถในการสั่งงานผ่านหน้าเว็บ (agentic) ซึ่งมีอยู่ใน Project Mariner แล้ว
  • Canvas: เครื่องมือสำหรับวาดและสร้างสรรค์เนื้อหาร่วมกัน
  • ความได้เปรียบเรื่องราคา: "ที่สำคัญคือ Gemini Live มันฟรีแบบไม่ต้อง subscribe ใดๆ ฟรีทุกคนแบบไร้เงื่อนไข เหตุผลก็เพราะว่ากูเกิลรวยมากจนทำแบบนี้ได้ (แล้วใครมันจะไปสู้ได้)" การเปิดให้ใช้งานฟรีนี้ถือเป็นจุดแข็งที่คู่แข่งรายอื่นยากที่จะเลียนแบบ

โมเดล LLM: เก่งที่สุด x ถูกที่สุด:

  • Gemini 2.5 Pro ขึ้นแท่นอันดับ 1: ในช่วงปี 2025 นี้ Gemini 2.5 Pro สามารถขึ้นมาครองอันดับ 1 ในการวัดประสิทธิภาพ (benchmark) ต่างๆ ได้สำเร็จ แสดงให้เห็นว่า Google มีศักยภาพในการสร้างโมเดลระดับแชมป์ได้แล้ว
  • Gemini 2.5 Flash: Workhorse Model: นอกจากโมเดลที่เก่งที่สุดแล้ว Google ยังมี Gemini 2.5 Flash ที่เน้นความเร็ว ราคาถูก และใช้ token น้อยลง เหมาะสำหรับงานทั่วไป โดยโมเดลนี้ได้รับการอัปเดตอย่างต่อเนื่องจนขึ้นมาติดอันดับ 2 รองจาก Gemini 2.5 Pro
  • Price/Performance ที่เหนือกว่า: "สิ่งที่เซอร์ไพร์สมากที่สุดใน I/O รอบนี้คือ Gemini 2.5 Flash มันถูกลงอีก เพราะใช้ token น้อยลงครับ ถ้าถามว่าภาพไหนที่สำคัญที่สุดใน I/O รอบนี้ ผมยกให้เป็นภาพ Pareto Frontier ที่แสดงวิธีคิดของกูเกิลในการสร้างโมเดล สังเกตว่าโมเดลของกูเกิล ซึ่งอยู่บนเส้นสีฟ้าในภาพ จะเป็นโมเดลที่อยู่ขวาบนสุดของตลาด ซึ่งหมายความว่า price/performance ดีที่สุดในตลาดนั่นเอง" แนวคิดการพัฒนาโมเดลของ Google ที่แสดงในภาพ Pareto Frontier แสดงให้เห็นถึงการให้ความสำคัญกับประสิทธิภาพต่อราคา ทำให้โมเดลของ Google มีความได้เปรียบในตลาดอย่างมาก
  • ผลกระทบต่อคู่แข่ง: "ตลาดโมเดล LLM ตอนนี้น่าจะอยู่ในระดับที่ "โมเดลอะไรก็ให้ผลลัพธ์พอๆ กัน" สำหรับงานส่วนใหญ่แล้ว ผมเพิ่งฟัง startup รายหนึ่งมานำเสนอผลิตภัณฑ์ ซึ่งเขาระบุว่าเลือกใช้ Gemini ด้วยเหตุผลนี้เลย คือ ความสามารถพอๆ กัน แต่ราคาถูกกว่ากันมาก ซึ่งอันนี้น่ากลัวมากสำหรับคู่แข่ง" การที่โมเดลของ Google มีความสามารถใกล้เคียงกับคู่แข่งแต่มีราคาที่ถูกกว่าอย่างมาก ถือเป็นภัยคุกคามสำคัญต่อผู้เล่นรายอื่นในตลาด

โมเดลประเภทอื่นก็จัดเต็ม:

  • ครบวงจรด้าน Multimodal: นอกจากโมเดลภาษา Google ยังเปิดตัวโมเดลสร้างภาพ (Imagen 4), วิดีโอ (Veo 3) และเพลง (Lyria 2) เวอร์ชันใหม่ โดย Veo 3 มีความสามารถในการสร้างเสียงประกอบวิดีโอได้แล้ว
  • เครื่องมือสร้างหนังด้วย AI: การเปิดตัว Flow ซึ่งเป็นเครื่องมืออำนวยความสะดวกในการสร้างหนังด้วย AI โดยใช้โมเดลต่างๆ ข้างต้น แสดงให้เห็นถึงการนำเทคโนโลยี AI ไปประยุกต์ใช้ในงานสร้างสรรค์ระดับสูง

Personalization จากข้อมูลที่มีอยู่แล้ว:

  • ความได้เปรียบจากข้อมูลมหาศาล: Google มีข้อมูลของผู้ใช้จากบริการต่างๆ เช่น Search, YouTube, Gmail, Photos จำนวนมหาศาล ทำให้สามารถปรับแต่งบริการ AI ให้ตรงกับความต้องการส่วนบุคคลได้โดยไม่ต้องให้ AI เรียนรู้ใหม่ทั้งหมด
  • ตัวอย่างการใช้งาน: การใช้ Gemini อ่านอีเมลและเอกสารเก่าเพื่อสรุปแผนการเดินทาง หรือการใช้ Gemini เขียนอีเมลแทนในภาษาของผู้ใช้เอง
  • Smart Reply ใน Gmail: การต่อยอด Personalized ไปสู่ฟีเจอร์ Smart Reply ที่มีความชาญฉลาดและตรงกับสไตล์การเขียนของผู้ใช้มากขึ้น

อนาคตของ Search กับ AI Mode:

  • การปรับตัวต่อการเปลี่ยนแปลง: Google ได้เปิดตัว AI Mode ใน Google Search เพื่อตอบสนองต่อแนวโน้มที่ผู้ใช้เริ่มย้ายไปใช้บริการ AI Chat หรือ Search แบบใหม่ เช่น ChatGPT หรือ Perplexity
  • AI Mode เหมือน Perplexity: ผู้เขียนอธิบายว่า AI Mode คือการเปลี่ยน interface หลักของ Google Search ให้มีลักษณะคล้ายกับ Perplexity
  • ผลกระทบต่อวงการ SEO และรายได้: Google ทราบดีว่าการนำ AI มาแทนที่ Web Search แบบเดิมจะส่งผลกระทบอย่างรุนแรงต่ออุตสาหกรรมเว็บและรายได้จากโฆษณา แต่การแข่งขันที่รุนแรงทำให้ Google ไม่มีทางเลือกอื่นนอกจากต้องปรับตัว
...more
View all episodesView all episodes
Download on the App Store

Happy Tech BlogBy HappyTechBlog