VNG Cloud Logo
Mô hình OpenAI mới nhất sẵn sàng trên VNG Cloud Model as a Service

2025/08/07 00:00

OpenAI vừa chính thức công bố hai mô hình mã nguồn mở (open-weight models) mới nhất: GPT-OSS-120B và GPT-OSS-20B. Sự kiện này đánh dấu một bước tiến quan trọng trong việc thúc đẩy AI mã nguồn mở, minh bạch và dễ tiếp cận hơn cho cộng đồng phát triển toàn cầu.

Tiếp tục khẳng định vị thế dẫn đầu, VNG Cloud cập nhật nhanh chóng hai mô hình AI mới nhất từ OpenAI trên nền tảng VNG Cloud Model as a Service, thuộc hệ sinh thái VNG Cloud AI Stack.

VNG Cloud Model as a Service  là nơi quy tụ các mô hình AI đến từ các nhà cung cấp đầu thế giới như OpenAI, Google, Anthropic, Deepseek,... cùng các mô hình chuyên biệt dành cho ngôn ngữ tiếng Việt và các ngành hàng đặc thù, giúp doanh nghiệp dễ dàng triển khai các dự án AI theo nhu cầu riêng.

Body (19).png
GPT-OSS-120B & GPT-OSS-20B tại VNG Cloud Portal

Hiệu năng cao trên hạ tầng tối ưu

Khác với các mô hình truyền thống dạng dense như GPT-3.5 hay Mistral 7B, các mô hình GPT-OSS áp dụng kiến trúc Mixture of Experts (MoE), chỉ kích hoạt một phần nhỏ tham số trong mỗi bước xử lý, thay vì toàn bộ mô hình. Nhờ đó, mặc dù mô hình có quy mô rất lớn nhưng yêu cầu phần cứng lại nhẹ hơn đáng kể.

  • GPT-OSS-120B có tổng cộng 120 tỷ tham số, nhưng chỉ kích hoạt khoảng 5.1 tỷ tham số mỗi bước tính toán

  • GPT-OSS-20B kích hoạt 3.6 tỷ tham số trong tổng số 20 tỷ

Bạn có thể sử dụng trực tiếp mô hình trên VNG Cloud Model as a Service   để triển khai nhanh chóng và dễ dàng tích hợp vào hệ thống hiện tại. Nếu cần mức độ tùy chỉnh cao hơn, bạn hoàn toàn có thể tự triển khai mô hình thông qua nền tảng inference hoặc Kubernetes Service với GPU NVIDIA H100 trên VNG Cloud AI Infrastructure.

Không chỉ tiết kiệm tài nguyên, GPT-OSS còn được tối ưu cho throughput cao, rất phù hợp để triển khai vào các dịch vụ AI thời gian thực như chatbot, API phản hồi nhanh, hoặc các hệ thống microservice.

Khám phá các tính năng mạnh mẽ

Các mô hình mới từ OpenAI không chỉ mạnh về xử lý ngôn ngữ tự nhiên, mà còn được thiết kế để giải quyết các bài toán cụ thể trong doanh nghiệp nhờ loạt tính năng mạnh mẽ.

Tính năng 

Mô tả 

Suy luận đa cấp độ (Reasoning Level Control)

Tùy chỉnh mức độ suy luận (low | medium | high) ngay trong prompt – phù hợp với từng bài toán, từ phản hồi nhanh đến phân tích phức tạp

Hiển thị luồng suy luận (Chain-of-Thought)

Truy xuất và kiểm thử logic nội bộ của mô hình, tăng độ tin cậy và dễ dàng debug trong các ứng dụng yêu cầu chính xác cao

Kết quả có cấu trúc (Structured Output)

Tạo đầu ra định dạng chuẩn như JSON, YAML, bảng… giúp dễ dàng tích hợp vào hệ thống sẵn có hoặc luồng xử lý tự động

Tích hợp công cụ và thực thi Python (Tool Calling & Code Interpreter)

Cho phép mô hình gọi công cụ bên ngoài, tìm kiếm trên web, thực thi mã Python – mở rộng khả năng tương tác và xử lý đa tác vụ

Tùy chỉnh linh hoạt (Custom Instruction & Fine-tuning Ready)

Dễ dàng điều chỉnh hành vi mô hình theo đặc thù ngành hoặc mục tiêu nghiệp vụ, sẵn sàng để fine-tune khi cần

Mã nguồn mở & triển khai không giới hạn

Tự do sử dụng và triển khai nhờ giấy phép mã nguồn mở Apache 2.0, không lo rào cản về bảo mật

 

Body (20).png
GPT-OSS-120B & GPT-OSS-20B tại VNG Cloud Portal

Ứng dụng cho nhiều bài toán cụ thể trong doanh nghiệp

Hai mô hình mới từ OpenAI hỗ trợ doanh nghiệp phát triển nhiều ứng dụng AI thiết thực, sát với nhu cầu vận hành.

Với chatbot nội bộ thông minh, doanh nghiệp có thể tích hợp công cụ sử dụng và xuất dữ liệu có cấu trúc, giúp chatbot không chỉ trả lời chính xác mà còn thực hiện các tác vụ như truy xuất thông tin, tạo báo cáo hay gọi API.

Trong khi đó, bài toán tự động hoá tài liệu được giải quyết hiệu quả nhờ khả năng trích xuất và định dạng dữ liệu từ văn bản dài thông qua kỹ thuật Chain-of-Thought (CoT), hỗ trợ xử lý hợp đồng, báo cáo, email… nhanh chóng và chính xác hơn.

Cuối cùng, với khả năng reasoning và tuỳ chỉnh hành vi theo ngữ cảnh, mô hình còn giúp xây dựng trợ lý ảo cho từng ngành hàng cụ thể như y tế, tài chính đến pháp lý, đảm bảo độ chính xác, đồng thời phù hợp với nghiệp vụ đặc thù của từng lĩnh vực.
 

Body (21).png
Phát triển các ứng dụng AI thiết thực

Từ ý tưởng đến triển khai chỉ trong vài phút

Được xây dựng trên hạ tầng GPU NVIDIA H100 hiệu suất cao, nền tảng VNG Cloud Model as a Service cho phép  bạn trải nghiệm ngay hai mô hình mới nhất này mà không cần lo lắng về cấu hình phức tạp hay triển khai hạ tầng đắt đỏ.

Bạn chỉ cần:

  • Tạo tài khoản trên VNG Cloud AI Platform

  • Truy cập ngay mô hình GPT-OSS-120B và GPT-OSS-20B tại portal: gpt-oss-120b hoặc gpt-oss-20b

Bắt đầu hành trình AI của bạn ngay hôm nay

Khơi mở sức mạnh AI với  GPT-OSS-120B và GPT-OSS-20B tạiVNG Cloud Model as a Service

Tìm hiểu VNG Cloud AI Stack – hệ sinh thái AI toàn diện giúp doanh nghiệp triển khai AI dễ dàng, tối ưu chi phí và nâng cao hiệu suất. Dù bạn là chuyên gia AI hay mới bắt đầu, chúng tôi có giải pháp phù hợp cho bạn.

article.read_more