Память становится следующим узким местом в индустрии чипов на фоне высокого спроса на искусственный интеллект

В 2026 году на рынке DRAM будет наблюдаться тенденция к росту спроса, поскольку искусственный интеллект способствует росту спроса, хотя разрыв в производительности между процессором и памятью становится критической проблемой.
Флэш-память NAND для хранения данных искусственного интеллекта будет опираться на спрос на DRAM, а новые виды памяти, такие как MRAM, ReRAM и FRAM, будут продолжать использовать более нишевые и менее объемные возможности и бороться с экономией за счет масштаба.
В "Отчете о перспективах развития памяти до 2026 года", подготовленном компаниейTechInsights, говорится о том, что ИИ достиг перепутья - традиционных технологий памяти уже недостаточно для удовлетворения требований к мощности и производительности, а значит, технология памяти становится узким местом в экономике данных. Наступающий год станет решающим для масштабирования памяти, чтобы в полной мере удовлетворить потребности ИИ.
В ходе брифинга для EE Times Майк Ховард, директор по рынкам DRAM и памяти TechInsights, заявил, что разрыв в производительности между процессором и памятью приведет к внедрению памяти с высокой пропускной способностью (HBM) и протокола CXL для решения проблемы "стены памяти".
Майк Ховард (Источник: TechInsights)Но эта стена - не единственная проблема в наступающем году, сказал Ховард. По его словам, "пьяные траты" гипермасштабирующих компаний, которые начались в конце 2023 года, чтобы нарастить мощности к 2025 году, привели к тому, что в отрасли не хватает мощностей для производства пластин, и производство смещается с DDR и LPDDR на HBM, чтобы удовлетворить спрос на ИИ. "Прибыль на HBM настолько высока, что эти парни падают ниц, чтобы увеличить мощности HBM".
По словам Говарда, также неясно, где находится потолок спроса на ИИ. "Мы просто не успеваем за ним с точки зрения пропускной способности."
Потребительские устройства примут на себя основную тяжесть дефицита DRAM
Центры обработки данных ИИ нуждаются не только в HBM, отметил Говард. Многим рабочим нагрузкам агентского ИИ нужны только традиционные серверы, на которые также наблюдается высокий спрос. По словам Говарда, "DRAM не хватит на всех".
По прогнозамTechInsights, в 2026 году SK Hynix выпустит 40 000 пластин, большая часть которых будет направлена на HBM. Samsung располагает некоторыми мощностями в Пхёнтхэке, но вторая фабрика Micron Technology в Айдахо будет запущена только в 2027 году, отметил он.
По словам Говарда, такой дефицит способствует росту цен и увеличению прибыли производителей DRAM из-за значительного дефицита и высокого спроса.
Этот бум не является беспрецедентным - рынки DRAM и флеш-памяти исторически развивались по схеме "бум - спад". Последний подъем спроса на память последовал за затишьем после пандемии, но даже минимумы выше, чем раньше, говорит Говард. "Мы больше не избавляемся от компаний. Мы закончили консолидацию".
По словам Говарда, все имеющиеся запасы памяти HBM или DDR5 достанутся крупным технологическим компаниям, у которых есть деньги, а значит, нехватка DRAM приведет к дефициту потребительских устройств, таких как смартфоны.
Жесткий прогнозTechInsight по памяти подтверждается еженедельным отчетом Counterpoint Research "Memory Solutions for GenAI", опубликованным в конце ноября. В нем прогнозируется, что цены на память могут вырасти на 50 % по сравнению с текущим уровнем до второго квартала 2026 года из-за критического дефицита микросхем.
По словам Ховарда, прогнозы высокого спроса на DRAM необходимо сдерживать неопределенностью, которая возникает в связи с появлением искусственного интеллекта - его быстрое появление в 2023 году может стать началом пузыря, который может лопнуть в следующем году. "На каждую историю о том, что спрос будет расти, найдется соответствующая история о пузыре ИИ".
Ховард добавил, что производители DRAM не забыли спад 2018 года, а многие прошли через спад 2008 года. "Они видели цикличность. Они реалисты".
Это означает, что в следующем году они собираются увеличить капвложения на 20 %, но с планами на случай, если им придется нажать на тормоза. "Они, возможно, потягивают Kool-Aid, но не от всей души."
Между тем, по словам Говарда, сосредоточенность на DRAM означает, что NAND будет уделяться немного меньше внимания. "По его словам, производители жестких дисков рассчитывают на 18-месячное окно для наращивания мощностей, но они не хотят оказаться в ситуации избыточного предложения. "Дефицит жестких дисков ведет к увеличению спроса на твердотельные накопители."
Недостаток инвестиций в NAND оказывает давление на системы хранения AI
По словам Ховарда, с момента появления AI пропускная способность стала более важной, что является благом для твердотельных накопителей. Однако в последние пять лет в NAND вкладывалось мало инвестиций - рентабельность была низкой, и инвестировать не хотелось.
Производитель твердотельных накопителей Phison USA внимательно следит за поставками NAND, сообщил EE Times Себастьен Жан, технический директор компании. "Индустрия NAND циклична, и мы пережили период, когда сокращение производства и спрос, вызванный искусственным интеллектом, привели к сокращению предложения."
Себастьен Жан (Источник: Phison USA)
По его словам, взгляд Phison несколько отличается от взгляда чистого производителя NAND, поскольку компания находится в центре экосистемы. "Мы тесно сотрудничаем со всеми основными производителями NAND, а также с широкой базой клиентов, работающих с серверами, автомобилями, промышленностью и играми, поэтому нам хорошо видны обе стороны уравнения спроса и предложения".
По словам Жана, с точки зрения операционной деятельности Phison уже планирует сокращение поставок. "Мы квалифицируем наши контроллеры и твердотельные накопители для нескольких поколений NAND и поставщиков. Мы компенсируем нехватку NAND за счет долгосрочных партнерских отношений и тесной координации с нашими поставщиками и клиентами".
По его словам, у Phison также есть возможность параллельного использования нескольких источников NAND. "Несмотря на то, что отрасли потребуются постоянные инвестиции, чтобы идти в ногу с дорожной картой развития ИИ и высокоплотных SSD, мы уверены в своей способности поддерживать наших корпоративных клиентов и заказчиков ИИ в течение предстоящих циклов."
Жан объяснил, что ИИ превратил систему хранения данных из фоновой службы в компонент производительности на переднем крае, который имеет решающее значение для работы конвейеров ИИ. Им нужны твердотельные накопители, способные поддерживать высокую пропускную способность и IOPS, сохраняя при этом контроль над хвостовыми задержками. "Это одна из основных причин, по которой мы видим, что предприятия переносят критически важные наборы данных ИИ с дисков на флэш-память", - говорит он.
Компания Phison видит потребность в новых классах твердотельных накопителей, специально оптимизированных для ИИ, которые выходят за рамки базовой скорости и задержек. "Размеры моделей и контекстных окон постоянно растут"
Это означает, что твердотельные накопители должны отвечать сразу двум жестким требованиям: больше памяти рядом с GPU и больше емкости в ярусе хранения. "Мы видим все большую координацию между GPU и SSD, что позволяет значительно улучшить пользовательский опыт без дополнительного риска размещения памяти непосредственно на GPU", - говорит Жан.
Эдж и автомобилестроение также стимулируют спрос на память
По словам Жана, помимо гипермасштабных и корпоративных центров обработки данных, Phison видит высокий спрос на SSD в пограничных и встраиваемых системах, а также в клиентских устройствах и на вертикальных рынках, таких как автомобилестроение и государственные учреждения.
"На границе робототехники, промышленного IoT и телекоммуникационных узлов начинают выполняться локальные выводы искусственного интеллекта, что делает необходимыми надежные флэш-накопители с низкой задержкой", - говорит он. Автомобильные платформы используют больше флэш-памяти для ADAS, автомобильных информационно-развлекательных систем и регистрации данных, а также мы наблюдаем безопасное развертывание локального ИИ в правительственных и оборонных учреждениях"."
Джин добавил, что общим для всех этих сегментов является то, что, как только ИИ становится частью рабочего процесса, вращающиеся диски не могут соответствовать требованиям к задержкам, мощности и долговечности, поэтому по умолчанию используются флэш-память.
Говард из TechInsights подтверждает эти тенденции - существуют граничные приложения с триллионами устройств, которым требуется больше памяти и хранилищ для работы ИИ. По его словам, автомобильный сегмент также является драйвером спроса, хотя и более медленным. "Содержание полупроводников в них неуклонно растет с течением времени".
Покупатели памяти для автомобилей отмечают рост цен, и, по словам Ховарда, более мелким покупателям DRAM придется бороться за распределение. По его словам, нехватка DRAM в сочетании с изменениями в аппаратном стеке может создать возможности для новых видов памяти. "Мы перешли от парадигмы вычислений с преобладанием CPU к парадигме вычислений с преобладанием GPU".
А учитывая "сумасшедший" рост цен на DRAM, новые виды памяти, которые еще полгода назад выглядели нерентабельными, начинают выглядеть лучше. Если сочетать это с каким-то увеличением производительности или дифференциацией, то можно открыть новые возможности"."
Возможности новой памяти не зависят от ИИ
На недавнем вебинаре, который совместно провели главный аналитик Objective Analysis Джим Хэнди и президент Coughlin Associates Том Кофлин, речь шла о том, что внедрение новых видов памяти, таких как MRAM, PCM, ReRAM и FRAM, не зависит от ИИ.
Джим Хэнди (Источник: Objective Analysis)Все эти виды памяти имеют общие признаки, говорит Хэнди. Среди них - однотранзисторная ячейка и более высокая скорость работы по сравнению с флэш-памятью. Все они энергонезависимы, в отличие от DRAM и SRAM. "Это большой плюс.
Технология 3D Xpoint PCM компании Intel, Optane, была попыткой перенести стойкость ближе к технологическому процессу, что имеет свои преимущества, сказал Хэнди, но создание инфраструктуры для ее поддержки заняло много времени.
Все новые виды памяти имеют возможности записи на место, которых нет в SRAM, NAND и NOR-флэш, что означает, что они имеют лучшие пределы масштабирования, сказал Хэнди. Они также обладают значительно большей выносливостью, чем флэш-память NAND. "Механизмы износа теперь не так сложны, как в случае с флэш-памятью".
Новые виды памяти могут быть как встроенными, так и дискретными. По словам Кофлина, встраиваемая память MRAM очень активна, особенно в связи с тем, что флэш-память NOR уходит на второй план во встраиваемых приложениях, поскольку она не масштабируется ниже 28 нм. "У нее также есть проблемы с выносливостью, если вы обновляете хранилище кода", - сказал он.
В настоящее время существует несколько типов MRAM, выпускаемых несколькими компаниями, включая Everspin, TSMC, Samsung и GlobalFoundries. "Существует широкая поддержка. Сейчас она занимает лидирующие позиции с точки зрения реальных применений".
По словам Кофлина, другим главным претендентом на победу является ReRAM, которой существует несколько типов для дискретных и встраиваемых приложений и которая в долгосрочной перспективе имеет потенциал превзойти другие новые виды памяти. "В ней используются материалы, которые уже широко распространены в производстве, и она также может быть устойчива к радиации", - сказал он. "Есть много разных игроков и много подходов к этому."
Том Кофлин (Источник: Coughlin Associates)Но, пожалуй, наиболее часто используемой новой памятью является FRAM, которая имеет большой объем производства в некоторых формах, но низкую скорость выпуска пластин, говорит Кофлин.
FRAM уже используется в приложениях финансовых смарт-карт, транзитных платежей и телеприставок. По сравнению с существующими технологиями EEPROM, FRAM более устойчива к повреждению данных под воздействием электрических полей и радиации.
По словам Кофлина, привлекательность FRAM заключается в ее низком энергопотреблении, высокой скорости и долговечности. Недостатки этой памяти заключаются в том, что она несовместима с традиционными технологическими процессами, а некоторые материалы не подходят для использования на полупроводниковых заводах.
Четвертая новая память, которая имеет потенциал, - это PCM, которая, по словам Кофлина, столкнулась с проблемами из-за высокой энергии и тепловой чувствительности. "Наиболее известной формой PCM является 3D Xpoint, разработанная совместно Micron и Intel, которую последняя вывела на рынок под названием Optane. По словам Кофлина, есть информация о том, что компании разрабатывают еще одну технологию на основе PCM, но в настоящее время никаких серьезных усилий по коммерциализации не предпринимается.
Новые виды памяти все еще испытывают трудности с экономией на масштабе
Хэнди говорит, что рыночные факторы влияют на то, насколько хорошо новые виды памяти принимаются по сравнению с укоренившимися стандартами, такими как DRAM и NAND flash.
Важным фактором является то, является ли память встроенной или дискретной, и это совершенно разные рынки; по словам Хэнди, в целом возможности для новых видов памяти связаны с нишевыми приложениями, где сейчас продаются как дискретные, так и автономные чипы памяти.
По словам Хэнди, военные и аэрокосмические рынки - это два рынка, где новые виды памяти найдут спрос, отчасти благодаря их устойчивости к радиации, будь то системы вооружения или спутники. На околоземной орбите много радиации. "Этот рынок может иметь низкие объемы, но цены на него чрезвычайно высоки", - говорит он. "Это стало своего рода спасительной благодатью для многих из этих компаний".
Промышленный рынок также осваивает новые виды памяти, как и сегмент медицинских носимых устройств, поскольку низкое энергопотребление позволяет увеличить срок службы батарей в устройствах слуховых аппаратов и кардиостимуляторов. По словам Хэнди, выносливость и надежность в широком диапазоне температур также являются привлекательными характеристиками новых видов памяти, особенно в автомобильной промышленности.
По его словам, поскольку флэш-память NOR и SRAM достигают пределов масштабирования, это должно стать "ветром" для новых видов памяти.
Общий прогноз Хэнди и Кофлина для новых запоминающих устройств заключается в том, что встраиваемые формы будут стимулировать ранние объемы, а объем пластин продолжит стимулировать экономию от масштаба, которая откроет новые рынки для автономных чипов.
Но достижение экономии от масштаба остается самым большим фактором, влияющим на внедрение новых запоминающих устройств, говорит Хэнди. "С помощью новых технологий можно уменьшить размер матрицы, но это не гарантирует, что деталь будет дешевле."
Объем пластины сильно влияет на стоимость производства новой памяти, а низкая цена всегда выигрывает у лучших характеристик. "У вас есть настоящая проблема курицы и яйца. Пока вы не сможете увеличить объемы производства, вы не сможете конкурировать с устоявшимися технологиями", - говорит Хэнди.
Эта статья была первоначально опубликована на сайте EE Times.
Гэри Хилсон - писатель-фрилансер и редактор, написавший тысячи статей для печатных и пиксельных изданий по всей Северной Америке. В сферу его интересов входят программное обеспечение, корпоративные и сетевые технологии, научные исследования и образование, экологичный транспорт и новости сообщества. Его статьи публиковались в журналах Network Computing, InformationWeek, Computing Canada, Computer Dealer News, Toronto Business Times, Strategy Magazine и Ottawa Citizen.
.
Подписаться на почтовую рассылку / Авторам сотрудничество






