Tenstorrent делает ставку на RISC-V и открытый исходный код, чтобы противостоять доминированию NVIDIA

С выходом чипа Blackhole в компании Tenstorrent начался новый этап технического и стратегического развития, сопровождающийся заметным подъёмом настроений внутри команды. Этот чип стал знаковым достижением и символом зрелости архитектурных решений компании. Руководитель Tenstorrent, поделившийся своими впечатлениями, отметил, что это был для него самый значимый день за последние годы — свидетельство не просто очередного релиза, а ключевого шага в реализации долгосрочной инженерной и продуктовой стратегии.
Новый чип Blackhole представляет собой высокопроизводительное решение, спроектированное специально для задач искусственного интеллекта, в том числе масштабного параллельного обучения и инференса. Его архитектура, построенная на принципах модульности, масштабируемости и энергоэффективности, позволяет строить системы, гибко адаптируемые под различные классы ИИ-нагрузок. Чип демонстрирует серьёзное улучшение по сравнению с предыдущими поколениями как в плане вычислительной плотности, так и по пропускной способности межсоединений.
Одновременно с этим важным анонсом, компания добилась прогресса на других фронтах. Их флагманский процессор Ascalon, основанный на открытой архитектуре RISC-V, достиг стадии бета-тестирования. Это означает, что платформа проходит испытания в реальных условиях, отлаживаются инструменты разработки, и тестируются сценарии использования, приближённые к продуктивной эксплуатации. Процессор Ascalon задуман как программируемое ядро с гибкими возможностями масштабирования, ориентированное не только на ИИ-вычисления, но и на выполнение сложных задач управления и синхронизации в распределённых системах.
Особое внимание заслуживает тот факт, что Tenstorrent начала формировать вокруг своей технологии активное сообщество. Их платформа вдохновляет независимых программистов и энтузиастов на создание собственных инструментов. Один из таких примеров — молодой разработчик, работающий над созданием собственного компилятора, адаптированного для чипов Tenstorrent. Это демонстрирует открытость архитектуры, доступность низкоуровневых интерфейсов и дружелюбие платформы к разработчикам, готовым вносить вклад в её экосистему.
Неподалёку от офиса компании в Санта-Кларе на доске от руки написано: "Мы победим!" — лозунг подкреплён результатами: на стеку TT-NN от Tenstorrent работают пять моделей, и ещё 15 находятся в разработке. Хотя прогресс по компилятору Forge MLIR немного отстаёт, общее движение вперёд ощутимо, чему способствует большая инженерная команда.
Полный переход на MLIR и модель с открытым исходным кодом нашёл отклик как внутри компании, так и за её пределами. Такой подход способствует сотрудничеству и привлекает инженеров, ценящих прозрачность и гибкость ПО. Архитектура на базе RISC-V отражает ту же философию, предлагая адаптивность, недоступную традиционным наборам инструкций.
Команда активно участвует в развитии open-source: в частности, они повысили производительность LLVM на 10%, и все улучшения были опубликованы в открытом доступе. Ставка на RISC-V стала стратегическим решением для Tenstorrent — они уверены, что эта технология опередит более ограниченные альтернативы. С ростом параллелизма в AI-коде контроль над архитектурой становится критическим преимуществом.
Хотя NVIDIA недавно открыла доступ к NVLink IP для избранных партнёров, Tenstorrent остаётся безразличной. Её системы используют стандартные Ethernet-соединения, что считается более практичным и экономичным решением. Их стратегия — противопоставить себя NVIDIA: создавать более компактное, простое и доступное железо с открытым ПО.
В том числе выбран GDDR6 вместо HBM, что снижает стоимость упаковки чипов без ущерба для возможностей. Логика проста: копировать лидера рынка — значит получить ограниченные выгоды и не развивать инновации. Вместо этого Tenstorrent стремится создать нечто принципиально новое.
Даже конкуренты в Китае используют open-source-инструменты Tenstorrent и сообщают об ошибках, которые компания готова исправлять — пример открытого взаимодействия, несмотря на границы. Старые чипы Wormhole можно легально поставлять в Китай, а новые, такие как Blackhole и Ascalon, подлежат ограничениям, и они были изначально спроектированы с учётом этих экспортных правил.
Относительно американских ограничений на экспорт ИИ и полупроводников, руководство Tenstorrent считает, что такие меры лишь ускорили технологическое развитие Китая. По их мнению, конкуренция должна основываться на креативности, а не на барьерах.
Расширяя глобальное присутствие, Tenstorrent уже имеет офисы в ряде европейских стран и теперь открывает представительство на Кипре для совместных исследований. Испания с её опытом в RISC-V и поддержкой со стороны государства также рассматривается как регион для роста. В Японии продолжается работа с местным производителем, который недавно выполнил поставку досрочно.
После выхода чипов Blackhole компания начала стремительно развивать и масштабировать свою инфраструктуру для обучения искусственного интеллекта, формируя мощную экосистему, способную поддерживать как текущие, так и будущие вычислительные потребности. В одной из существующих конфигураций используется шесть высокопроизводительных систем Galaxy, каждая из которых содержит 32 специализированных чипа, что в сумме даёт 192 чипа. Эта инфраструктура служит основой для обучения ИИ-моделей и закладывает фундамент для последующего масштабирования — как по числу задействованных вычислительных узлов, так и по сложности архитектуры систем.
Финальная архитектура задумывается как интегрированная вычислительная платформа, объединяющая несколько ключевых компонентов. Во-первых, это движки обучения — высокооптимизированные вычислительные блоки, обеспечивающие матричные операции и работу с большими объёмами тензорных данных. Во-вторых, узлы коммутации — специализированные сетевые модули, предназначенные для сверхбыстрой маршрутизации данных между чипами и кластерами, что критически важно при масштабировании. В-третьих, модули оптимизации и балансировки нагрузки, предназначенные для обеспечения равномерного распределения вычислительных задач и предотвращения узких мест. Вся система проектируется с высокой степенью резервирования, что гарантирует отказоустойчивость и бесперебойную работу даже в случае сбоя отдельных компонентов.
Хотя одна из сторонних компаний разрабатывает собственную стековую архитектуру на базе чипов Tenstorrent для специфических продуктовых задач, основная вычислительная платформа, предназначенная для внутреннего обучения, создаётся самой Tenstorrent. Это подчёркивает их стремление к полному контролю над вычислительным стеком и оптимизации его под собственные требования. Для задач инференса, т.е. запуска уже обученных моделей, достаточно четырёх систем Galaxy, поскольку они обеспечивают достаточную пропускную способность и вычислительную плотность. Однако задачи обучения остаются в фокусе стратегического развития компании, поскольку именно они определяют гибкость и инновационность будущих ИИ-решений.
Ключевая идея заключается в том, что устойчивое технологическое преимущество строится не только на текущей производительности моделей, но и на способности внешних и внутренних пользователей адаптировать платформу под создание новых, более сложных систем. Этот двойной фокус — одновременная поддержка обучения и инференса — отражает реальную сложность инженерных задач, лежащих в основе современной ИИ-инфраструктуры. Слишком упрощённое представление о "железе для ИИ" как просто совокупности матричной математики и программного обеспечения искажает реальность: при построении масштабируемых систем критическое значение приобретают вопросы энергоэффективности, теплового контроля, топологии соединений и надёжности сетевых протоколов.
Самым амбициозным проектом компании является разработка уникальной обучающей платформы, объединяющей до двух миллионов RISC-V-ядер в рамках единой программной модели. Это значит, что одна управляющая программа будет координировать всю систему, эффективно распределяя задачи, синхронизируя ресурсы и минимизируя задержки. При этом компания подчёркивает, что ИИ не является универсальным типом вычислений, как традиционные процессоры общего назначения.
Вместо этого он требует специализированных архитектур, оптимизированных под конкретные виды операций — таких как тензорные свёртки, нормализации, матричные умножения и трансформерные механизмы. Тем не менее, способность небольшой инженерной команды реализовать столь масштабный проект свидетельствует о высокой степени зрелости их технической экспертизы и позволяет надеяться на прорывные достижения в области AI-инфраструктуры.
Философия Tenstorrent проста: создавать чрезвычайно мощные вычислительные машины, способные справляться с задачами следующего поколения. Именно эта идея — выйти за рамки возможного и построить систему с колоссальной производительностью и масштабируемостью — вдохновляет их больше всего.
Подписаться на почтовую рассылку / Авторам сотрудничество






