Стартап на базе FPGA бросает вызов Nvidia благодаря эффективному использованию памяти

12.03.2025

Молодой стартап в сфере AI-аппаратного обеспечения делает ставку на FPGA-технологии как альтернативу традиционным GPU-решениям в центрах обработки данных. Использование программируемых логических матриц (FPGA) позволяет добиваться высокой производительности и энергоэффективности при выполнении задач машинного обучения, особенно в области инференса крупных языковых моделей (LLM).

Всего через 18 месяцев после основания компания Positron начала поставки своих FPGA-решений, демонстрируя быстрый выход на рынок и высокую конкурентоспособность. Недавно она выполнила первый многомиллионный заказ для облачного провайдера Tier 2, что подтверждает растущий спрос на её технологии. В ближайшие месяцы ожидается значительное расширение масштабов поставок, что может укрепить позиции компании в индустрии AI-ускорителей.

Дополнительно около 20 потенциальных клиентов тестируют AI-устройство Atlas, используя его как локально, так и через удалённый доступ. Это свидетельствует о серьёзном интересе рынка к FPGA-решениям для инференса и возможном переходе к массовому внедрению технологии. Если Positron удастся масштабировать производство и продемонстрировать преимущества FPGA перед традиционными GPU, стартап может стать важным игроком в сегменте AI-ускорителей, конкурируя с крупнейшими производителями оборудования для машинного обучения.

Быстрый выход на рынок и стратегическое финансирование

Компания Positron была основана в апреле 2023 года ветеранами индустрии с глубоким опытом в разработке AI-чипов. С момента запуска стартап уже привлёк $23,5 млн финансирования и недавно назначил нового CEO с экспертизой в сфере AI-инфраструктуры, что подчёркивает его амбиции по расширению присутствия на рынке.

В отличие от многих AI-стартапов, сталкивающихся с длительными циклами разработки аппаратного обеспечения, Positron сделала ставку на быстрый вывод продуктов на рынок. Использование FPGA вместо традиционного процесса создания ASIC позволило компании значительно сократить время разработки, предлагая клиентам гибкие и легко адаптируемые решения для инференса крупных языковых моделей (LLM).

Компания уже заявила о планах перехода на собственный ASIC-ускоритель, что позволит добиться ещё большей производительности и энергоэффективности. Однако пока разработка находится в процессе, ставка на FPGA позволяет оперативно адаптировать продукты под запросы клиентов и быстрее наращивать присутствие в индустрии.

Такой подход помогает Positron избежать проблем, с которыми столкнулись стартапы первого поколения AI-чипов, ориентированные на долгосрочную разработку и сложный процесс кастомизации. Гибкость и скорость вывода решений дают компании конкурентное преимущество, позволяя ей уже сегодня поставлять высокопроизводительные AI-ускорители в центры обработки данных.

Гибкость развертывания и модель AI-устройства

Хотя некоторые клиенты приобретают PCIe-карты оптом, компания Positron ориентируется на облачных провайдеров, которые привыкли к инфраструктуре Nvidia. Чтобы упростить интеграцию своих решений, Positron разработала аппаратный модуль Atlas, который позволяет беспрепятственно заменять или дополнять существующие GPU-решения без необходимости значительных изменений в инфраструктуре.

Формат appliance делает внедрение Atlas максимально удобным для заказчиков, снижая технические барьеры для перехода с GPU на FPGA-ускорители. Такой подход особенно важен для дата-центров, где критична совместимость с уже развернутыми стеками ПО.

"Наш подход минимизирует трение для клиентов. Им не нужно перекомпилировать модели или кардинально менять рабочие процессы — Atlas работает из коробки", — объясняют в Positron.

Эта стратегия позволяет компании быстрее завоёвывать рынок, предлагая альтернативу GPU, которая сочетает в себе гибкость FPGA и удобство развертывания. Если Positron сможет масштабировать поставки и убедить крупных облачных провайдеров в конкурентных преимуществах Atlas, у компании есть все шансы занять нишу в индустрии AI-ускорителей.

Оптимизированное использование памяти для AI-инференса

Аппаратная платформа Atlas демонстрирует значительное преимущество перед традиционными GPU-решениями, обеспечивая:

На 70% более быструю обработку токенов по сравнению с инференсом на Nvidia Hopper.
В 3,5 раза лучшую производительность на ватт и на доллар, что делает её экономически выгодной для развертывания в масштабных облачных средах.

Ключ к такому приросту эффективности — оптимизированное использование памяти, а не просто увеличение вычислительных мощностей. В основе Atlas лежит FPGA Altera Agilex-7M, оснащённая 32 ГБ HBM и несколькими каналами DDR5. В отличие от GPU, которые часто не могут полностью задействовать свою теоретическую пропускную способность памяти, архитектура Positron поддерживает 93% от пикового значения, что даёт ощутимое преимущество в реальных задачах.

Главное преимущество Atlas — глубокое понимание специфики AI-нагрузок. В то время как сверточные нейросети (CNN) требуют высокой вычислительной мощности, трансформерные модели (например, для LLM) ограничены пропускной способностью и объёмом доступной памяти. В этом контексте Positron делает ставку не на FLOPS, а на максимальную эффективность работы с памятью, обеспечивая ускорение инференса без чрезмерного энергопотребления.

Такой подход позволяет Atlas конкурировать с GPU не только по скорости обработки данных, но и по энергоэффективности, делая его привлекательным решением для облачных провайдеров и центров обработки данных, которые ищут баланс между производительностью и затратами.

Дорожная карта оборудования

Следующее поколение Atlas, запланированное к выпуску в конце 2025 года, принесёт значительные улучшения, делая платформу ещё более конкурентоспособной.

Среди ключевых изменений:

Переход с корпуса 4U на 2U, что уменьшит занимаемое пространство в серверных стойках.
Увеличение объёма DDR-памяти, что повысит пропускную способность для работы с крупными моделями.
Оптимизации архитектуры, которые позволят превзойти Nvidia Blackwell в 5 раз по производительности на ватт.

Параллельно Positron ведёт разработку ASIC-чипа для AI-инференса, который выйдет в начале 2026 года. В отличие от FPGA-версии, новый чип будет использовать LPDDR вместо HBM, что значительно снизит стоимость, сохранив высокую эффективность. Это станет возможным благодаря проприетарным алгоритмам управления памятью Positron, которые обеспечивают максимальную пропускную способность, даже при использовании LPDDR.

Кроме того, будущий ASIC получит встроенные сетевые функции, позволяя устройствам соединяться напрямую без внешних сетевых карт (NIC). Это упростит масштабирование до 256 узлов, устраняя необходимость в сложной коммутационной инфраструктуре.

Эти инновации делают Positron не просто игроком в сфере AI-инференса, а потенциальным лидером, предлагающим более гибкие, энергоэффективные и экономически выгодные решения по сравнению с традиционными GPU-архитектурами.

Производство в США

С учётом геополитических рисков и нестабильности в цепочках поставок AI-оборудования, Positron делает ставку на производство в США, следуя стратегии локализации критической инфраструктуры.

Ключевые элементы производства:

FPGA Agilex-7M уже выпускаются в Аризоне, что снижает зависимость от зарубежных поставщиков.
ASIC-чипы для AI-инференса будут производиться на новом заводе TSMC в Тусоне, который станет ключевым центром полупроводникового производства в США.
LPDDR-память и другие компоненты также планируется закупать у американских производителей, минимизируя зависимость от азиатских поставщиков.

В настоящее время финальная сборка устройств ведётся в Вашингтоне, но с увеличением объёмов производства Positron планирует перевести производство в Неваду. Это позволит масштабировать выпуск и снизить логистические издержки, учитывая близость к крупным технологическим хабам.

Такой подход полностью соответствует государственной политике США, направленной на локализацию AI-инфраструктуры и снижение зависимости от зарубежных технологий. Это не только повышает устойчивость цепочек поставок, но и укрепляет позиции Positron как одного из немногих производителей AI-оборудования с полностью локализованным производственным процессом.

Новый игрок в AI-оборудовании

Используя гибкость FPGA, оптимизацию памяти и простоту развертывания, Positron зарекомендовала себя как серьёзный конкурент в сфере AI-инференса, предлагая альтернативу традиционным GPU-решениям.

Благодаря стратегии быстрого вывода продуктов на рынок, компания не только обеспечила себе устойчивый рост, но и смогла привлечь значительные инвестиции, подтвердив востребованность своих технологий. Растущая клиентская база, включая облачных провайдеров, активно тестирующих Atlas, говорит о высокой заинтересованности в альтернативных AI-ускорителях, способных предложить лучшую энергоэффективность и экономичность.

Чёткий переход к собственным ASIC-чипам подтверждает, что будущее AI-вычислений формируется не только вокруг GPU, но и новых архитектур, адаптированных под специфические нагрузки. Positron делает ставку на оптимизированное использование памяти, что особенно важно для инференса крупных языковых моделей (LLM).

Сочетая технические инновации, локализованное производство и гибкость в адаптации решений, Positron укрепляет свои позиции в быстроразвивающейся сфере AI-аппаратного обеспечения, формируя новое поколение вычислительных платформ.

Наши новости один раз в неделю на ваш емайл
Подписаться на почтовую рассылку / Авторам сотрудничество