xuân

Startup DeepSeek của Trung Quốc khiến cổ phiếu công nghệ khắp thế giới ‘sụp đổ’, nhận mưa lời khen từ giới công nghệ

Nvidia gọi mô hình R1 của DeepSeek là ‘tiến bộ AI xuất sắc’, bất chấp sự xuất hiện của startup đã ‘thổi bay’ 600 tỷ USD vốn hóa của nhà sản xuất chip.

Startup AI DeepSeek của Trung Quốc đang thu hút sự quan tâm của giới công nghệ toàn cầu. (Nguồn: Sipa)
Startup AI DeepSeek của Trung Quốc đang thu hút sự quan tâm của giới công nghệ toàn cầu. (Nguồn: Sipa)

Trả lời CNBC, người phát ngôn Nvidia gọi mô hình R1 của DeepSeek là “tiến bộ AI xuất sắc”. Công trình của DeepSeek cho thấy, các mô hình mới có thể được tạo ra bằng kỹ thuật Test Time Scaling như thế nào.

Tin liên quan
Phó Thủ tướng Bùi Thanh Sơn: Luật Khoa học và Công nghệ (sửa đổi) phải tạo lợi thế cạnh tranh trong phát triển khoa học công nghệ Phó Thủ tướng Bùi Thanh Sơn: Luật Khoa học và Công nghệ (sửa đổi) phải tạo lợi thế cạnh tranh trong phát triển khoa học công nghệ

Trong kỹ thuật Test Time Scaling mà Nvidia đề xuất, một mô hình AI được đào tạo đầy đủ khi dành nhiều thời gian hơn để “suy luận” trong quá trình đưa ra dự đoán hoặc tạo ảnh, văn bản, nó sẽ cung cấp câu trả lời tốt hơn.

Bình luận được Nvidia đưa ra sau khi DeepSeek phát hành R1, mô hình suy luận nguồn mở được đánh giá là vượt trội so với các mô hình tốt nhất của Mỹ. Chi phí đào tạo R1 theo DeepSeek là chưa tới 6 triệu USD, chỉ bằng một phần rất nhỏ so với hàng tỷ USD mà Silicon Valley bỏ ra để phát triển các mô hình AI của mình.

"Cú sốc" DeepSeek đã khiến cổ phiếu công nghệ khắp thế giới sụp đổ. Ngày 27/1, cổ phiếu Nvidia giảm 17% giá trị, tương đương 600 tỷ USD vốn hóa bị "thổi bay", mức thiệt hại lớn nhất trong lịch sử doanh nghiệp Mỹ.

Một nhân vật máu mặt khác trong giới AI – Yann LeCun, nhà khoa học AI trưởng của Meta - cũng dành lời khen ngợi cho DeepSeek. Ông cho rằng nó đã chứng minh “các mô hình nguồn mở đang vượt qua mô hình độc quyền”.

“Họ nảy ra ý tưởng mới và xây dựng dựa trên công trình của người khác. Vì công trình của họ được công khai và là nguồn mở, mọi người có thể hưởng lợi từ nó. Đó chính là sức mạnh của nghiên cứu mở và nguồn mở”, ông viết trên Threads.

Tuyên bố của Nvidia có thể được hiểu theo cách đột phá của DeepSeek đang tạo ra nhiều việc làm hơn cho các bộ xử lý đồ họa (GPU) của hãng. Phát ngôn viên Nvidia giải thích, việc suy luận đòi hỏi số lượng GPU khổng lồ. Ngoài ra, người này khẳng định GPU mà DeepSeek sử dụng hoàn toàn tuân thủ quy định kiểm soát xuất khẩu của Mỹ.

Các nhà phân tích đang đặt câu hỏi liệu chi phí đầu tư hàng tỷ USD từ các công ty như Microsoft, Google và Meta dành cho hạ tầng AI có đang lãng phí hay không khi có thể đạt kết quả tương tự với chi phí rẻ hơn.

Đầu tháng 1, Microsoft cho biết sẽ chi 80 tỷ USD cho hạ tầng AI riêng năm 2025, còn CEO Meta Mark Zuckerberg gần đây nói dự định đầu tư từ 60 đến 65 tỷ USD chi phí vốn năm nay như một phần của chiến lược AI lớn hơn. Bản thân Zuckerberg là người ủng hộ các mô hình nguồn mở.

Tháng 9/2024, ông từng nói, mục tiêu trong 10-15 năm tới là tạo ra thế hệ các nền tảng mở mới và giúp các nền tảng mở “chiến thắng”, dẫn đến ngành công nghệ năng động hơn.

'); $('.hna-banner-inpage').insertAfter($('#divfirst')); })