xs
xsm
sm
md
lg

กูเกิล เปิดตัว “Gemini 3” เข้าใจทั้ง “ตัวอักษร ภาพ และเสียง” ย้ำโมเดลฉลาดสุดที่เคยสร้างมา

เผยแพร่:   ปรับปรุง:   โดย: ผู้จัดการออนไลน์



กูเกิล (Google) ประกาศเปิดตัว ‘Gemini 3’ โมเดลปัญญาประดิษฐ์รุ่นใหม่ ที่โดดเด่นในเรื่องการให้เหตุผลระดับสูง เพิ่มความสามารถในการเข้าใจทั้งตัวอักษร ภาพ และเสียง ในโมเดลเดียวกัน เคลมเป็น "โมเดลที่ฉลาดที่สุดเท่าที่เคยสร้างมา" เพิ่มโหมด Agent ทำงานได้ล้ำขึ้น และเครื่องมือใหม่สำหรับนักพัฒนา "Google Antigravity" เปลี่ยนวิธีการเขียนโค้ดให้ง่ายขึ้น

ซุนดาร์ พิชัย ซีอีโอของ Google และ Alphabet ระบุว่า นี่คือยุคใหม่ของ AI ที่มีความฉลาดอย่างแท้จริง พร้อมให้ข้อมูลว่า ปัจจุบันฟีเจอร์ AI Overviews มีผู้ใช้งานกว่า 2 พันล้านคนต่อเดือน และแอป Gemini มียอดผู้ใช้ทะลุ 650 ล้านคน ซึ่ง Gemini 3 จะเข้ามาสานต่อความสำเร็จนี้ด้วยความสามารถที่ก้าวกระโดดจากการอ่านและมองเห็น ไปสู่การ "คิดและไตร่ตรอง" (Reasoning and Thinking) อย่างลึกซึ้ง

ขณะเดียวกัน ยังมีข้อมูลว่า ส่วนหนึ่งที่ทำให้จำนวนผู้ใช้งาน Gemini เพิ่มสูงขึ้น มาจากไวรัลของการใช้งาน Nano Banana ที่เป็น AI สำหรับการสร้างภาพที่ได้รับความนิยมอย่างสูงในประเทศไทย อินโดนีเซีย และอินเดีย

ผลการทดสอบ Gemini 3
Koray Kavukcuoglu ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยี Google DeepMind เปิดเผยว่า Gemini 3 คือผลลัพธ์จากการวิจัยกว่าทศวรรษ โดยรุ่น Gemini 3 Pro สามารถทำคะแนนทดสอบแซงหน้าทุกโมเดลในตลาด รวมถึงรุ่นก่อนหน้าอย่าง Gemini 2.5 Pro ในทุกเกณฑ์มาตรฐาน (Benchmarks)


ไม่ว่าจะเป็นการทำคะแนนของ LM Arena ทะลุ 1,501 คะแนน ทิ้งห่างคู่แข่งและรุ่นเดิมถึง 50 Elo points มีฉลาดระดับปริญญาเอก ทำคะแนน 91.9% ในการทดสอบ GPQA Diamond (ความรู้ระดับบัณฑิตศึกษา) และสามารถแก้โจทย์ยากโดยไม่ต้องใช้ตัวช่วย ทำคะแนน 37.5% ใน Humanities Last Exam ซึ่งวัดความเข้าใจที่ซับซ้อนโดยไม่ต้องใช้เครื่องมือเสริม

“สิ่งที่น่าตื่นเต้นที่สุดอย่างหนึ่งเกี่ยวกับ Gemini 3คือสามารถใช้เพื่อเรียนรู้ทุกสิ่งได้เปลี่ยนจากการเป็นแค่เครื่องมือตอบคำถามมาเป็นคู่หูที่ปรับตัวเข้ากับความต้องการไม่ว่าจะพยายามเรียนรู้ทักษะใหม่,สร้างโปรเจกต์ที่สร้างสรรค์หรือวางแผนชีวิต”

นอกจากนี้ Google ยังเปิดตัว "Gemini 3 DeepThink" โหมดการคิดวิเคราะห์เชิงลึกสำหรับสมาชิกระดับ Ultra ที่ออกแบบมาเพื่อแก้ปัญหาทางคณิตศาสตร์และวิทยาศาสตร์ที่ซับซ้อนที่สุด โดยมีความแม่นยำและความน่าเชื่อถือในระดับสูงสุด

Google Antigravity ปฏิวัติวงการนักพัฒนาด้วย "Agent-First"

Google Antigravity
ไฮไลต์สำคัญของงานคือการเปิดตัว "Google Antigravity" แพลตฟอร์มพัฒนาซอฟต์แวร์รูปแบบใหม่ (Agentic Development Platform) ที่ไม่ได้เป็นแค่เครื่องมือช่วยเขียนโค้ด แต่ทำหน้าที่เป็นผู้ช่วยที่พร้อมรับคำสั่งได้ตลอดเวลา

ทำให้สามารถใช้ Vibe Coding เพื่อให้ Gemini 3 เขียนโค้ดแบบที่เน้นผลลัพธ์ สามารถป้อนคำสั่งให้สร้างแอปพลิเคชัน, เกมกราฟิก 3 มิติ, หรือ วิดีโอของ Sci-fi world ที่มีแสงเงาสมจริงได้จากคำสั่งภาษาเพียงไม่กี่คำ

ใน Antigravity นักพัฒนาสามารถสั่งงานระดับสูง (High-level tasks) เช่น "สร้างแอปติดตามเที่ยวบิน" แล้วปล่อยให้ AI วางแผน แตกงานย่อย เขียนโค้ด ตรวจสอบความถูกต้อง (Validate) และรันผ่าน Browser หรือ Terminal ได้เองโดยอัตโนมัติ

นอกจากนี้ ยังเลือกให้ทำงานร่วมกับโมเดลสร้างภาพอย่าง Nano Banana เพื่อจัดการเรื่อง Visual ในแอปได้ทันทีทำให้การพัฒนาแอปฯ ทำได้สะดวก และรวดเร็วมากขึ้น

Google Search และแอป Gemini ได้ใช้ Gemini 3 ทันที


สำหรับผู้ใช้งานทั่วไป Gemini 3 จะเข้ามาเปลี่ยนประสบการณ์การค้นหาและใช้งานแอป ทั้ง AI Mode ที่เพิ่มฟีเจอร์การค้นหาที่ลึกซึ้งยิ่งขึ้น สามารถสร้าง "Dynamic View" หรือหน้าจอโต้ตอบแบบเรียลไทม์ เช่น หากค้นหาเรื่องสินเชื่อ ระบบจะสร้างเครื่องคำนวณสินเชื่อที่ปรับเปลี่ยนตามข้อมูลเราได้ทันที หรือสร้างแบบจำลอง 3D เพื่ออธิบายการทำงานของเซลล์ร่างกาย


ส่วนในแอป Gemini ผู้ใช้สามารถสั่งงานข้ามแอปได้ราบรื่นขึ้น เช่น สั่งให้จัดการอีเมลใหม่ใน Gmail, วางแผนการเดินทาง และจองตั๋วเครื่องบินได้เสร็จสรรพในคำสั่งเดียว โดย Gemini 3 มีความสามารถในการวางแผนระยะยาว (Long-horizon planning) ที่แม่นยำกว่ารุ่นก่อนอย่างเห็นได้ชัด

Gemini ช่วยวางแผน และนำเสนอข้อมูลออกมาพร้อมรูปภาพได้แล้ว
ทั้งนี้ Gemini 3 Pro เปิดให้ใช้งานแล้ววันนี้ในรูปแบบ Preview ผ่าน Gemini App และ Google Search (AI Mode) ส่วนนักพัฒนา สามารถเข้าถึงโมเดลผ่าน Gemini API, AI Studio และแพลตฟอร์ม Google Antigravity (Public Preview) ได้เช่นเดียวกัน


กำลังโหลดความคิดเห็น