Новости

Новостной портал GADGETPAGE » Новости » Kneron представила чип KL1140: как стартап хочет перенести большие языковые модели с облаков на периферию

Kneron представила чип KL1140: как стартап хочет перенести большие языковые модели с облаков на периферию

Американский стартап Kneron, основанный в 2015 году инженером Альбертом Лю, сообщил о создании нового чипа для искусственного интеллекта — KL1140. По данным SiliconANGLE, это ускоритель, предназначенный для запуска больших языковых моделей (LLM) прямо на периферийных устройствах — от промышленных контроллеров до ноутбуков и бытовой электроники.

Появление такого решения означает потенциальный разворот всей отрасли: если большие модели смогут эффективно работать вне дата-центров, это снизит зависимость от облаков, уменьшит задержки и даст пользователям больше контроля над данными. Чтобы понять масштаб, нужно разложить по полочкам — кто разработал чип, что он делает, когда и почему его создали, и какие задачи он должен решить.

Как возник Kneron и почему именно эта компания делает ставку на периферию

Kneron появился в Калифорнии как исследовательский стартап, ориентированный на энергоэффективные решения для искусственного интеллекта. Ещё в 2017–2018 годах компания привлекла внимание Samsung, Qualcomm и Hon Hai (Foxconn), которые вложились в разработку компактных ИИ-чипов.

Основатель стартапа Альберт Лю ранее работал с системами компьютерного зрения в Qualcomm и исследовательских центрах США. Его идея заключалась в том, что ИИ должен работать не только в облаке, но и рядом с пользователем — там, где важна скорость и приватность.

Первые продукты Kneron представляли собой энергоэффективные NPU для камер наблюдения и «умных» дверных звонков. К 2023 году компания заявила, что уже более 120 млн устройств по всему миру используют её технологии.

Запуск KL1140 стал логичным развитием: рынок больших языковых моделей вырос до миллиардов долларов, спрос на локальные решения стал очевидным, а конкурентов в сегменте edge‑LLM пока немного.

Что представляет собой KL1140 и чем он отличается от облачных решений

KL1140 — это специализированный ускоритель для выполнения моделей ИИ на конечных устройствах. Его ключевые особенности:

поддержка больших языковых моделей до десятков миллиардов параметров;
низкое энергопотребление, позволяющее использовать его в устройствах без активного охлаждения;
— способность обеспечивать инференс в реальном времени без обращения к облакам;
— аппаратная оптимизация под модели форматов INT4 и INT8.

По данным Kneron, KL1140 позволяет запускать LLM локально в 10–20 раз дешевле, чем в облаке, и при этом — с меньшими задержками.

Для сравнения: работа той же модели в облаке требует мощных GPU вроде NVIDIA A100 или H100, которые потребляют сотни ватт и стоят десятки тысяч долларов. KL1140 рассчитан на другую нишу — компактные устройства, которые должны выполнять задачи ИИ автономно.

Почему запуск LLM на периферии становится трендом

Есть несколько причин, которые в последние годы усилились одновременно:

1. Приватность данных

Когда модель работает локально, личные данные пользователя — медиафайлы, переписка, биометрия — не уходят в облако. Для медицинских, корпоративных и государственных систем это критически важно.

2. Задержки и автономность

Ответы LLM в облаке зависят от скорости интернета и загрузки серверов. Локальный чип даёт предсказуемую скорость и не зависит от удалённых дата‑центров.

3. Стоимость

Облачный ИИ требует дорогостоящих GPU и постоянных расходов на аренду серверов. Периферийные ускорители уменьшают финансовую нагрузку.

4. Регуляции

В конце 2020‑х годов США, ЕС и Китай начали усиливать требования к работе с персональными данными. Локальный ИИ помогает компаниям соответствовать нормам GDPR, HIPAA и другим стандартам.

Где могут использоваться чипы KL1140

Kneron заявляет, что чип подходит для широкого спектра устройств:

— промышленные контроллеры и умные роботы;
— камеры видеонаблюдения и домашняя электроника;
— банкоматы и терминалы;
— автомобили с системами автономного вождения;
— ноутбуки и компактные рабочие станции.

Например, в робототехнике KL1140 позволит выполнять сложные команды на месте, не отправляя данные по сети. В потребительских устройствах это может привести к «умным» колонкам, которые понимают речь без подключения к интернету.

Как KL1140 может изменить рынок ИИ‑ускорителей

Крупнейшие игроки в сегменте — NVIDIA, Intel, AMD — по-прежнему ориентируются на облачную инфраструктуру. Kneron идёт противоположным путём: переносит вычисления ближе к пользователю.

Если чип покажет стабильную производительность и будет интегрирован в массовые устройства, это может привести к нескольким изменениям:

снижение давления на дата‑центры, которые сегодня перегружены LLM‑нагрузками;
— появление новых классов автономных гаджетов;
— перераспределение инвестиций от облаков к edge‑решениям;
— рост конкуренции в сегменте энергоэффективных ускорителей.

Некоторые аналитики называют периферийные ИИ‑чипы «следующей фазой эволюции» рынка искусственного интеллекта.