Đầu năm 2025, các mô hình AI quy mô lớn của Trung Quốc như DeepSeek nhanh chóng lan rộng trong ngành công nghiệp công nghệ, số lượng người dùng vượt qua con số hàng trăm triệu. ngoai hang anh Là một mô hình suy diễn tiên tiến dựa trên kiến trúc Transformer, DeepSeek có quy mô tham số khổng lồ, đặt ra yêu cầu cao về khả năng tính toán phần cứng, dung lượng bộ nhớ và băng thông.
Công ty Yiswei Computing trên nền tảng tự nghiên cứu RISC-V SoC tính toán thông minh Trên bảng phát triển EVB của dòng EIC77 – bao gồm EIC7700X và EIC7702X, đã thành công tích hợp mô hì
Bảng EVB sử dụng SoC tính toán thông minh EIC77 của Yiswei Computing
EIC7700X/EIC7702X tích hợp các module gia tốc phần cứng như NPU, GPU, DSP, cùng với bộ nhớ LPDDR5 dung lượng lớn và băng thông cao, đảm bảo tối ưu hóa tài nguyên phần cứng khi xử lý mô hình DeepSeek quy mô lớn, giúp chuyển tải nhanh các tham số mô hình, từ đó nâng cao đáng kể hiệu suất suy diễn.
Kết quả kiểm tra (xem hình bên dưới), khi chạy mô hình DeepSeek-distill-qwen với quy mô 7 tỷ tham số, bảng phát triển EVB tích hợp EIC7700X của Yisiwei có thể đạt tốc độ suy diễn lên đến 7 tokens/giây, trong khi bảng phát triển EVB tích hợp EIC7702X đạt tốc độ 14 tokens/giây, cho thấy hiệu suất năng lượng vượt trội so với các kiến trúc tương tự.
Kết quả kiểm tra SoC tính toán thông minh RISC-V của Yiswei Computing thích hợp với mô hình DeepSeek
Dòng EIC77 là SoC tính toán thông minh độc lập do Yisiwei phát triển, sử dụng tiến trình 12nm, tích hợp CPU RISC-V P550 64-bit 4 nhân thực thi hỗn loạn, NPU hiệu năng cao tự phát triển, cùng với DSP, GPU và bộ giải mã H.264/H. b29 club Khả năng xử lý AI của nó đạt tới 20 TOPS INT8, hỗ trợ dung lượng bộ nhớ LPDDR5 lên đến 32GB ở tần số 6400MHz, đồng thời hỗ trợ toàn bộ tính toán dấu phẩy động và mô hình ngôn ngữ lớn.
Trong đó, SoC AI hai Die EIC7702X tích hợp CPU RISC-V P550 64-bit 8 nhân thực thi hỗn loạn, khả năng xử lý AI đạt tới 40 TOPS INT8, hỗ trợ dung lượng bộ nhớ LPDDR5 lên đến 64GB ở tần số 6400MHz.
Sơ đồ khối module EIC7700X
Bảng phát triển tích hợp EIC7700X/EIC7702X có dung lượng bộ nhớ LPDDR từ 32/64 GB, giao diện PCIe Gen3 4/8 kênh, hỗ trợ SATA3, HDMI2.0, Ethernet 1000M, USB3.2, MIPI.
j88 đăng nhập
có thể thực hiện nhiều chức năng như thị giác máy tính, phân loại đối tượng, định vị mục tiêu, phân đoạn hình ảnh, nhận diện tư thế hành động, xử lý ngôn ngữ tự nhiên, phù hợp cho nhiều ứng dụng như vận hành an ninh, kiểm tra công nghiệp, giáo dục thông minh, xe tự lái, robot, drone, giao thông thông minh.
Ngoài bảng phát triển, sản phẩm EIC77 còn bao gồm nhiều dạng sản phẩm khác như AI BOX, AI PC, card gia tốc máy chủ, phục vụ cho nhiều môi trường làm việc như đám mây, biên và thiết bị đầu cuối, đa chiều mở rộng khả năng xử lý AI.
Ứng dụng rộng rãi
Trong thời gian ngắn, dòng EIC77 đã hoàn thành công tác tích hợp mô hình DeepSeek, thể hiện rõ khả năng sử dụng hiệu quả sức mạnh tính toán và tính phổ quát, tiện lợi của công cụ phần mềm phát triển. Sản phẩm có thể thích ứng với nhiều thuật toán học sâu, dễ sử dụng, phản ánh tính thực tiễn trong kỹ thuật sau nhiều thế hệ cải tiến kiến trúc.
Với sự phát triển nhanh chóng của công nghệ AI, Yisiwei sẽ tiếp tục theo đuổi lộ trình RISC-V + AI, cung cấp các sản phẩm và giải pháp với hiệu năng và hiệu suất năng lượng vượt trội hơn, không ngừng mở rộng các ứng dụng mới, mang lại hỗ trợ về sức mạnh tính toán AI cho nhiều ngành nghề.