OpenAI vs Google: Gemini เปิดตัว Live Rolls เพื่อแข่งขันกับโหมดเสียงของ ChatGPT – ความท้าทายใหม่เกิดขึ้น

โดย:C, Fiona
Last updated:08/14/2024
Why Trust BTCC
BTCC, a seasoned player in the cryptocurrency sector, has established a solid foundation of credibility through its over a decade of platform operation and profound industry experience. The platform boasts an experienced team of professional analysts who leverage their keen market insights and profound understanding of blockchain technology to offer precise market analyses and investment strategies to users. Furthermore, BTCC adheres to rigorous editorial standards, ensuring that every report and analysis is fact-based, striving for objectivity and fairness, thus providing investors with authoritative insights they can rely on. In the rapidly evolving cryptocurrency market, BTCC stands out as an indispensable partner for numerous investors and enthusiasts due to its stability, professionalism, and forward-thinking approach.

OpenAI vs Google: Gemini เปิดตัว Live Rolls เพื่อแข่งขันกับโหมดเสียงของ ChatGPT - ความท้าทายใหม่เกิดขึ้น
OpenAI Vs Google: ยักษ์ใหญ่ด้านเทคโนโลยีกำลังเปิดตัว Gemini Live ซึ่งเป็นฟีเจอร์แชทด้วยเสียงสำหรับผู้ช่วย AI Gemini เพื่อแข่งขันกับ Advanced Voice Mode ใหม่ของ OpenAI สำหรับ ChatGPT ฟีเจอร์ที่เป็นนวัตกรรมนี้เปิดเผยในงาน Made by Google ปี 2024 สำหรับผู้ใช้แพ็กเกจขั้นสูง โดยสัญญาว่าจะได้รับประสบการณ์โต้ตอบด้วยเสียงที่ราบรื่นด้วยเทคโนโลยี AI คอยติดตามการอัปเดตเพิ่มเติมเกี่ยวกับการพัฒนาที่น่าตื่นเต้นนี้ในการแข่งขัน AI ระหว่าง Google และ OpenAI

OpenAI กับ Google: โหมดเสียงของ Gemini Live Challenge ChatGPT ได้ไหม

ในกระทู้บน X บริษัทได้ประกาศเปิดตัว Gemini Live โดยมีเป้าหมายที่จะแข่งขันกับโหมดเสียงขั้นสูงของ OpenAI ที่เพิ่งเปิดตัวสำหรับ ChatGPT ฟีเจอร์ใหม่นี้ซึ่งเปิดตัวในงานปี 2024 ขณะนี้ผู้ใช้ Gemini Advanced สามารถเข้าถึงได้แล้ว ซึ่งจะช่วยปรับปรุงการโต้ตอบของ AI ด้วยวิธีการที่เป็นธรรมชาติและยืดหยุ่นมากขึ้น ผู้ใช้สามารถขัดจังหวะ สลับหัวข้อ หรือสนทนาต่อได้อย่างอิสระ โดยสะท้อนความเป็นธรรมชาติของการโทร Gemini Live โดดเด่นด้วยระบบเสียงพูดแบบใหม่ที่ Google ยกย่องว่าเป็นการนำเสนอบทสนทนาหลายรอบที่สอดคล้องกัน เปี่ยมไปด้วยอารมณ์ และไหลลื่นอย่างเป็นธรรมชาติ ด้วยเสียงที่เป็นธรรมชาติถึง 10 เสียง อีกทั้งยังมีความสามารถในการเลียนแบบคำพูดของผู้ใช้แบบเรียลไทม์ ยกระดับประสบการณ์ AI ไปสู่อีกระดับหนึ่ง ยิ่งไปกว่านั้น โหมดแฮนด์ฟรีนี้ยังทำงานได้อย่างราบรื่นในพื้นหลังหรือเมื่อโทรศัพท์ล็อคอยู่ ทำให้มั่นใจได้ว่าการสนทนาจะไม่ถูกรบกวนในขณะที่ผู้ใช้ทำงานหลายอย่างพร้อมกัน Gemini Live ช่วยให้บริษัทก้าวไปข้างหน้าอย่างมากในการแข่งขัน AI ท้าทาย OpenAI และสร้างอนาคตของการโต้ตอบ AI ด้วยเสียง –

เราจะปรับปรุงการโต้ตอบของ AI ได้อย่างไร

ด้วยเหตุนี้ ผู้ช่วย AI รุ่น Gemini 1.5 Pro และ Gemini 1.5 Flash จึงอำนวยความสะดวกในการสนทนาที่ขยายวงกว้างและซับซ้อน เนื่องจากมีหน้าต่างบริบทที่ยาวกว่าเมื่อเปรียบเทียบกับโมเดล AI ทั่วไปอื่นๆ ความก้าวหน้านี้ทำให้ Gemini Live สามารถมีส่วนร่วมในการอภิปรายที่ยืดเยื้อมากขึ้น ขณะเดียวกันก็จัดเก็บข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น นอกจากนี้ บริษัทยังได้ประกาศด้วยว่าอินพุตหลายรูปแบบซึ่งจัดแสดงครั้งแรกที่ Google I/O 2024 จะถูกรวมไว้ใน Gemini Live ภายในสิ้นปีนี้ ซึ่งขยายขอบเขตไปไกลกว่าแค่คำสั่งเสียง การบูรณาการนี้จะช่วยเพิ่มความเข้าใจและการตอบสนองต่อ AI ของภาพ เช่น รูปภาพและวิดีโอ ทำให้สามารถปรับเปลี่ยนได้ดียิ่งขึ้น ในปัจจุบัน การอัปเกรดนี้มีให้เฉพาะผู้ใช้ Android ที่พูดภาษาอังกฤษ แต่จะมีการรองรับภาษาเพิ่มเติมและอุปกรณ์ iOS ในเร็วๆ นี้
ในขณะที่บริษัทเปิดตัวฟีเจอร์ล่าสุด ก็กำลังเตรียมพร้อมสำหรับการบูรณาการและความก้าวหน้าเพิ่มเติม ในอีกไม่กี่สัปดาห์ข้างหน้า Gemini จะได้รับส่วนขยายใหม่ที่เข้ากันได้กับแอป Google รวมถึงปฏิทิน, Keep, Tasks และ YouTube Music การบูรณาการเหล่านี้สัญญาว่าจะปรับปรุงกิจวัตรประจำวันของผู้ใช้ ทำให้พวกเขาสามารถจัดการเพลย์ลิสต์ การเตือนความจำ และตารางเวลาได้อย่างมีประสิทธิภาพผ่านคำสั่งเสียงง่ายๆ นอกจากนี้ ผู้ใช้ Android จะสามารถเปิดใช้งาน Gemini บนแอปพลิเคชันใดก็ได้ผ่านปุ่มเปิดปิดหรือเสียงเตือนในเร็วๆ นี้ ฟังก์ชันการทำงานที่เป็นนวัตกรรมใหม่นี้จะช่วยให้ผู้ใช้มีส่วนร่วมกับ Gemini ผ่านแอปพลิเคชันต่างๆ การสอบถาม หรือสร้างเนื้อหา เช่น รูปภาพ ที่ผสมผสานเข้ากับขั้นตอนการทำงานได้อย่างราบรื่น

OpenAI รับมือกับความท้าทายด้วยโหมดเสียงขั้นสูงอย่างไร

ในการแข่งขัน OpenAI Vs Google ที่กำลังดำเนินอยู่ การเปิดตัวโหมดเสียงขั้นสูงสำหรับ ChatGPT ของ Google เผชิญกับความท้าทายหลายประการในระหว่างขั้นตอนการทดสอบอัลฟ่าเบื้องต้น แม้ว่าโหมดนี้มีจุดมุ่งหมายเพื่อปรับปรุงประสบการณ์ผู้ใช้โดยนำเสนอการโต้ตอบการสนทนาที่เหมือนจริงมากขึ้น แต่ก็ได้จุดประกายการวิพากษ์วิจารณ์ที่อาจส่งเสริมการพึ่งพา AI มากเกินไปเนื่องจากการแลกเปลี่ยนเสียงที่สมจริงอย่างมาก เมื่อเร็วๆ นี้ OpenAI ได้หยิบยกข้อกังวลด้านความปลอดภัยเกี่ยวกับการเกิดขึ้นของความผูกพันทางสังคมระหว่างผู้ใช้กับ AI ซึ่งอาจเป็นอันตรายต่อความสัมพันธ์ระหว่างมนุษย์กับมนุษย์ เพื่อแก้ไขปัญหาเหล่านี้และปรับปรุงความสามารถด้าน AI บริษัทได้พยายามค้นหาวิธีการเสริมความสามารถทางวิศวกรรมซอฟต์แวร์ของโมเดล AI อย่างแข็งขัน ส่วนหนึ่งของความพยายามเหล่านี้ OpenAI ได้เปิดตัวชุดย่อยที่ประเมินโดยมนุษย์ของเกณฑ์มาตรฐาน SWE-bench ซึ่งออกแบบมาเพื่อให้การประเมินที่แม่นยำมากขึ้นว่าโมเดล AI สามารถรับมือกับความท้าทายของซอฟต์แวร์ในโลกแห่งความเป็นจริงได้ดีเพียงใด การพัฒนาล่าสุดนี้ถือเป็นความมุ่งมั่นอย่างต่อเนื่องเพื่อให้แน่ใจว่าความก้าวหน้าใน AI ยังคงปลอดภัยและใช้งานได้จริงสำหรับการใช้งานในชีวิตประจำวัน

ลงทะเบียนเลยตอนนี้เพื่อเริ่มต้นเส้นทางคริปโตของคุณ

ดาวน์โหลดแอป BTCC ผ่านทาง App Store หรือ Google Play

ติดตามเรา

สแกนเพื่อดาวน์โหลด