SiMa.ai представила второе поколение чипов Edge AI с мульти-модальным фокусом
Компания SiMa.ai выпустила второе поколение своих MLSoC-чипов, разработанных для удовлетворения растущего спроса на крупные мульти-модальные модели (LMMs) и генеративный ИИ (GenAI) на периферии. Стартап, известный своим программно-ориентированным подходом, отвечает на изменяющиеся потребности клиентов в робототехнике, промышленной автоматизации, интеллектуальных системах видеонаблюдения и новых сегментах, таких как медицинские устройства.
Новое поколение аппаратного обеспечения, названное Modalix, представляет значительный шаг вперед, объединяя поддержку как сверточных нейронных сетей (CNN), так и трансформерных сетей. SiMa продолжит поддержку своего первого поколения чипов с фокусом на обработке визуальных данных, но теперь выходит на более широкий рынок ИИ-приложений.
Modalix представляет семейство устройств с производительностью 25, 50, 100 и 200 TOPS при INT8, причем версия на 50 TOPS уже поступает на тестирование в этом квартале. По словам генерального директора SiMa, чипы с 50 TOPS оптимальны для сложной робототехники и автомобильных систем, в то время как решения с 25 TOPS подходят для упрощенных трансформерных моделей. Модели с 100 и 200 TOPS находятся в разработке, с потенциальным использованием чиплет-дизайна.
Новый чип на 50 TOPS имеет меньший размер кристалла по сравнению с предшественником и добавляет расширенную функциональность благодаря переходу с 16 нм на техпроцесс TSMC N6. Энергопотребление чипа остается исключительно эффективным — 8-10 Вт для всего SoC, что делает его идеальным для периферийных решений. Полная программная совместимость между поколениями SiMa упрощает переход для разработчиков.
Улучшенная архитектура для LMM и LLM
Архитектура SiMa теперь ориентирована на крупные языковые модели (LLMs) и мульти-модальные приложения, что позволяет значительно повысить точность вычислений и общую производительность системы. В отличие от подходов, предполагающих внедрение множества форматов с плавающей точкой, компания сделала выбор в пользу BF16. Этот формат позволяет добиться оптимального баланса между необходимой вычислительной точностью и энергоэффективностью, что особенно важно для периферийных решений с ограниченными ресурсами.
Дополнительно было реализовано аппаратное ускорение для критически важных функций, таких как активация и выполнение нелинейных операций, на которых базируется работа современных крупных языковых моделей. Это нововведение не только сокращает время вычислений, но и повышает эффективность обработки данных даже при больших объемах.
Пропускная способность DRAM была увеличена вдвое, что позволило существенно улучшить скорость передачи данных внутри системы. Параллельно внедрены усовершенствованные технологии кэширования, ускоряющие доступ к информации и сокращающие время отклика системы. Эти улучшения в совокупности приводят к впечатляющим приростам производительности, обеспечивая возможность запуска моделей вроде Llama2-7B со скоростью более 10 токенов в секунду. Это достижение особенно ценно для устройств, которые работают в условиях жестких ограничений на энергопотребление, таких как решения для периферийного ИИ.
Инструментарий программного обеспечения SiMa, в свою очередь, разработан с акцентом на максимальную оптимизацию производительности. Послойная оптимизация обеспечивает эффективное распределение вычислительных ресурсов и позволяет добиваться высокой скорости обработки данных без потерь на этапе выполнения задач. При этом компания сохранила полную программную совместимость между поколениями своих чипов, что значительно упрощает процесс перехода на новое оборудование для разработчиков и партнеров.
Расширенные CPU и периферия
Количество ядер Arm Cortex-A65 удвоилось — с четырех до восьми, чтобы CPU соответствовали растущим требованиям ИИ-нагрузок. Процессоры обеспечивают выполнение задач для неподдерживаемых слоев или функций, позволяя выполнять полные приложения на одном чипе.
Modalix добавляет несколько новых функций на основе отзывов клиентов:
- Процессор обработки изображений (ISP): Добавлен для задач предварительной обработки в визуальных конвейерах, улучшая гибкость обработки изображений.
- Улучшенная подключаемость: Чип поддерживает 4 x 4 MIPI-линии для камер и сенсоров, включая LiDAR и радары, а также обновленные порты Ethernet с 4x 1G до 4x 10G.
- Улучшения PCIe: Поддержка PCIe Gen5 с возможностью взаимодействия root complex-to-endpoint открывает потенциал для чиплет-решений.
Аппаратное обеспечение сохраняет DSP Synopsys EV74 от SiMa, который теперь работает на 20% быстрее, поддерживая критически важный для ключевых клиентов DSP-код.
Реальные применения и сценарии использования на периферии
Чипы второго поколения Modalix от SiMa ориентированы на быстро развивающиеся периферийные приложения, где крупные языковые модели (LLM) и генеративный искусственный интеллект (GenAI) не просто демонстрируют высокую технологическую эффективность, но и обеспечивают реальный экономический эффект. Это позволяет клиентам внедрять решения, которые приносят конкретную финансовую отдачу и повышают общую производительность бизнес-процессов. Важнейшими рынками для применения таких чипов остаются робототехника, автомобильные системы с функциями автономного управления, промышленная автоматизация, интеллектуальные камеры для видеонаблюдения и медицинские устройства, где точность, скорость обработки и энергоэффективность являются критически важными показателями.
Особое внимание компания уделяет роли трансформерных моделей, которые стремительно становятся ключевыми в задачах периферийной визуализации. Это особенно заметно на примере востребованных решений клиентов, использующих модели, такие как ViT (Vision Transformer) и LlaVa. Такие модели позволяют эффективно анализировать визуальные данные в реальном времени, даже на устройствах с ограниченными ресурсами, что существенно расширяет возможности применения периферийного ИИ.
В то время как использование GenAI в крупных дата-центрах нередко вызывает сомнения в своей рентабельности из-за высоких затрат на вычислительные мощности и энергообеспечение, компания SiMa видит реальный коммерческий потенциал именно в периферийных приложениях. В таких сферах, как робототехника и автомобильные системы, существует высокий и стабильный спрос на мульти-модальные ИИ-решения, которые сочетают производительность, гибкость и экономичность. Эти отрасли уже сегодня демонстрируют ощутимый эффект от внедрения интеллектуальных технологий, снижая операционные издержки и увеличивая эффективность рабочих процессов.
Обеспечивая впечатляющую вычислительную мощность, минимальное энергопотребление и непрерывную программную совместимость между поколениями чипов, SiMa.ai нацелена на завоевание лидерских позиций на рынке периферийного искусственного интеллекта. Платформа Modalix, благодаря своей универсальности и возможности масштабирования, представляет собой стратегически важное решение, способное адаптироваться к различным сценариям использования и соответствовать растущим потребностям клиентов в эпоху стремительного развития технологий.
Подписаться на почтовую рассылку / Авторам сотрудничество