Tuesday, October 8, 2024
AICloudGenerative AINEWS

Alibaba Cloud ประกาศความก้าวหน้าของ Tongyi โมเดลพื้นฐานปัญญาประดิษฐ์ขนาดใหญ่

TongYi

Alibaba Cloud ประกาศความก้าวหน้าของ ทงอี้ หรือ โมเดลพื้นฐานปัญญาประดิษฐ์ขนาดใหญ่ที่สามารถรองรับการทำงานกับข้อมูลหลายประเภทในหลายอุตสาหกรรม พร้อมโชว์ยูสเคสช่วยพัฒนาอนาคตของวงการรถยนต์

าลีบาบา คลาวด์ ประกาศ ณ งาน Apsara Conference ซึ่งเป็นงานประจำปีครั้งสำคัญของบริษัทฯ ว่า ทงอี้ (Tongyi) ซึ่งเป็นโมเดลโครงสร้างพื้นฐานที่เป็นกรรมสิทธิ์ของบริษัทฯ มีลูกค้าใช้งานมากกว่า 300,000 รายผ่าน ModelStudio ซึ่งเป็นแพลตฟอร์ม Generative AI ของบริษัทฯ เพิ่มขึ้นอย่างก้าวกระโดดจากจำนวนลูกค้า 90,000 รายเมื่อแรกเปิดตัวในเดือนพฤษภาคม

Tongyi ซึ่งเป็นโมเดลพื้นฐานปัญญาประดิษฐ์ขนาดใหญ่ของ Alibaba Cloud และโครงสร้างพื้นฐานคลาวด์ มีความสามารถที่เหมาะสำหรับธุรกิจในแวดวงยานยนต์ เกม การท่องเที่ยว และไอที สามารถมอบประสบการณ์ที่ดียิ่งขึ้นให้ลูกค้า และสามารถพัฒนาโซลูชันใหม่ๆ ได้อย่างมีประสิทธิภาพมากขึ้น 

โชว์เอไอยูสเคสช่วยพัฒนาอนาคตของวงการรถยนต์ 

Alibaba_Cloud เปิดตัวโซลูชันโมเดลขนาดใหญ่ (large multimodal model: LMM) ที่มีความสามารถหลายประการ ออกแบบมาสำหรับแอปพลิเคชันด้านยานยนต์ โซลูชันนี้เป็นการพัฒนาร่วมกันของ NVIDIA และ Banma ซึ่งเป็นผู้ให้บริการโซลูชันสำหรับส่วนของผู้ขับขี่ยานยนต์ (cockpit) อัจฉริยะของอาลีบาบา 

โซลูชันนี้จะให้บริการแก่ผู้ผลิตยานยนต์ในประเทศจีน โดยมีเป้าหมายเพื่อให้เจ้าของยานยนต์ได้สัมผัสกับประสบการณ์เชิงโต้ตอบได้มากขึ้น และเป็นการกำหนดนิยามใหม่ให้แก่การเดินทางที่ขับเคลื่อนอย่างชาญฉลาด

ความร่วมมือนี้เป็นการนำพอร์ตโฟลิโอ Qwen ซึ่งเป็นโมเดลภาษาขนาดใหญ่ที่เป็นกรรมสิทธิ์ของ Alibaba Cloud ประกอบด้วย โมเดลภาษา Qwen2-7B และ โมเดลภาษาภาพ Qwen2-VL ไปผสานรวมเข้ากับแพลตฟอร์ม NVIDIA DRIVE AGX Orin เพื่อใช้งานด้านยานยนต์อัตโนมัติ 

นอกจากนี้ เทคโนโลยีเร่งความเร็วโมเดลของ NVIDIA ยังช่วยลดค่าใช้จ่ายในการคำนวณลงอย่างมาก และลดเวลาในการตอบสนองของงานประมวลผลแบบเรียลไทม์ที่ซับซ้อนของโมเดลต่างๆ ของ Alibaba Cloud เพื่อให้มั่นใจว่าผู้ขับขี่และผู้โดยสารจะได้สัมผัสประสบการณ์การขับเคลื่อนอัจฉริยะอย่างไร้อุปสรรค

Qwen-VL รันบน NVIDIA DRIVE AGX Orin สามารถจดจำป้ายสถานที่จอดรถ และร่วมในการสนทนาโต้ตอบไปมาได้ (เครดิตภาพ: NVIDIA)

ความสามารถของ Owen ในการรับมือกับคำถามที่ซับซ้อน และการประมวลผลภาพที่ชาญฉลาด จะทำให้ระบบเสียงผู้ช่วยในรถยนต์ (in-car voice assistants) สามารถโต้ตอบการสนทนาไปมาได้อย่างไดนามิก สามารถให้คำแนะนำต่างๆ ตั้งแต่การให้ข้อมูลเกี่ยวกับสถานที่สำคัญที่อยู่ใกล้ๆ ไปจนถึงการให้คำแนะนำกับผู้ขับขี่ เช่น แนะนำให้เปิดไฟหน้ารถในช่วงที่หิมะตก 

Mobile Agent ของ Alibaba Cloud ซึ่งเป็น multimodal AI agent สำหรับอุปกรณ์ edge และเป็นส่วนหนึ่งของโซลูชัน LMM นี้ จะช่วยเพิ่มความสามารถให้กับระบบเสียงผู้ช่วยในรถยนต์ Mobile Agent มีจุดแข็งที่โดดเด่นด้านการวางแผนงานที่ซับซ้อน สามารถสังเกตและวิเคราะห์ตนเอง และทำการตัดสินใจ ดังนั้นขณะอยู่ในรถยนต์ ผู้ขับขี่และผู้โดยสารจะได้สัมผัสประสบการณ์ที่น่าทึ่งและสนุกสนาน เช่น ใช้คำสั่งเสียงสั่งมิลค์เชคผ่านแอปส่งอาหาร เป็นต้น

ในอนาคต Alibaba Cloud วางแผนทำงานร่วมกับ NVIDIA ในการใช้โมเดล Owen กับ NVIDIA DRIVE Thor ซึ่งเป็นแพลตฟอร์มประมวลผลรถยนต์แบบรวมศูนย์รุ่นใหม่ของ NVIDIA แพลตฟอร์มนี้รวมเอาระบบผู้ช่วยเหลือในการขับขี่ขั้นสูง การขับขี่อัตโนมัติ และความสามารถของ AI cockpit ไว้ด้วยกันบนระบบที่ปลอดภัยเพียงระบบเดียว

ร่วมมือกับค่ายรถ XPENG เพิ่มประสบการณ์อัจฉริยะให้กับส่วนของผู้ขับขี่

XPENG บริษัทผู้ผลิตยานยนต์ไฟฟ้าอัจฉริยะของจีน ใช้โมเดล AI และสมรรถนะด้านการประมวลผลคลาวด์ที่แข็งแกร่งของ Alibaba Cloud ในการปรับโฉมส่วนผู้ขับขี่อัจฉริยะและสร้างประสบการณ์การขับขี่อัตโนมัติ

XPENG นำ Owen ของ Alibaba Cloud ไปใช้เพิ่มประสิทธิภาพให้แก่ Xiao P ซึ่งเป็นระบบเสียงผู้ช่วย AI ของบริษัทฯ เพื่อมอบประสบการณ์ในส่วนของผู้ขับขี่ที่ชาญฉลาดมากขึ้น ระบบเสียงผู้ช่วยที่ใช้ LLM นี้ สามารถเข้าใจบริบทการสนทนาที่ซับซ้อน และเข้าใจความตั้งใจต่างๆ ของผู้ใช้ได้เป็นอย่างดี 

โดยไม่ต้องใช้คำแนะนำเฉพาะทางใดๆ ทั้งยังสามารถโต้ตอบกับคนขับและผู้โดยสารได้อย่างเป็นธรรมชาติ เช่น เมื่อคนขับหรือผู้โดยสารเพียงพูดว่า “ในรถหนาว” ระบบเสียงผู้ช่วยจะปรับอุณหภูมิของรถให้โดยอัตโนมัติ

นอกจาก XPENG จะใช้ Owen กับส่วนผู้ขับขี่อัจฉริยะแล้ว ยังร่วมกับ Alibaba Cloud ทำการผสานรวมโมเดลขนาดใหญ่ต่างๆ เพื่อสร้างสรรค์นวัตกรรมอื่นๆ อีกหลากหลาย เช่น ผู้ใช้สามารถออกแบบสติกเกอร์ตามต้องการเพื่อตกแต่งภายนอกรถของตนได้ ผ่านทางโมบายแอปของ XPENG ด้วยการใช้ ทงอี้ ว่านเซี่ยง (Tongyi Wanxiang) ซึ่งเป็นโมเดลแปลงข้อความเป็นรูปภาพ (text-to-image model) ของ Alibaba Cloud 

นอกจากนี้ XPENG กำลังพิจารณาใช้ ทงอี้ หลิงมา (Tongyi Lingma) ของ Alibaba Cloud ซึ่งเป็นผู้ช่วยเขียนโค้ด AI ที่มี Owen เป็นเทคโนโลยีเบื้องหลัง เพื่อเพิ่มประสิทธิภาพด้านการวิจัยและพัฒนาด้านเทคโนโลยียานยนต์ใหม่ๆ Alibaba Cloud ยังได้นำเสนอทรัพยากรประมวลผลทรงประสิทธิภาพแก่ XPENG เพื่อช่วยเร่งการเทรนโมเดลขนาดใหญ่สำหรับการขับขี่อัตโนมัติของบริษัทฯ