В настоящее время контент, созданный ИИ (AIGC), оказывает глубокое влияние на многие сферы производственной деятельности: от планирования маршрутов и рекомендаций по покупкам до автономного вождения и интеллектуального производства.
Несмотря на то, что крупные модели AIGC быстро прошли путь от технической разработки до применения в реальном мире, они сталкиваются с растущими проблемами в удовлетворении специализированных, персонализированных потребностей. Крупные модели часто не могут глубоко интегрироваться в конкретные отрасли, что приводит к ограниченным сценариям применения, непоследовательным результатам и отсутствию высококачественных данных
Рассмотрим преимущества, которые дают модели вертикальных отраслей по сравнению с крупными моделями.
Меньший масштаб и низкие затраты
Модели вертикальных отраслей имеют меньший масштаб и требуют меньше вычислительной мощности и ресурсов, чем крупные модели, для которых часто требуются огромные кластеры GPU со значительными затратами. Эти небольшие модели ориентированы на конкретные области, точно решая ключевые проблемы. Их компактный размер означает меньшую потребность в аппаратных ресурсах, простоту развертывания и более низкий барьер для входа. Эти модели эффективно работают как в облачных, так и в граничных вычислениях.
Персонализация под конкретные нужды
Основная цель вертикальных моделей - более полное удовлетворение индивидуальных потребностей клиентов. Оптимизируя и обучаясь на основе отраслевых данных, эти модели предлагают более точные и индивидуальные решения, направленные на решение реальных бизнес-задач. Например, они могут улучшить управление цепочками поставок, повысить качество обслуживания клиентов за счет сокращения времени отклика, предоставить индивидуальные консультации или рекомендации по принятию бизнес-решений с более высокой доходностью.
Быстрота реагирования и гибкость
Благодаря меньшему количеству параметров и меньшим затратам на обучение вертикальные модели могут быстро реагировать на запросы рынка, корректируя и итерируя их по мере необходимости. Такая гибкость создает для предприятий больше возможностей для более оперативного ведения бизнеса.
В настоящее время вертикальные отраслевые модели широко используются в различных секторах экономики, такие, как финансы, электронная коммерция, образование и здравоохранение.
Для поддержки обучения моделей компания Gooxi представила платформу Eagle Stream - 4U 8-GPU AI-сервер, поддерживающий 1 или 2 масштабируемых процессора Intel® Xeon® 4-го или 5-го поколения и позволяющий использовать до 8 GPU-карт полной мощности 600 Вт двойной ширины. Платформа поддерживает различные топологии прямого соединения CPU-GPU и коммутируемого соединения, обеспечивая полноскоростную связь между GPU. В эталонных тестах с llama2 решение с прямым подключением достигло скорости вычислений ≥768Toks (70B@4090*8). Также поддерживается несколько карт ускорителей ИИ, что позволяет удовлетворить потребности различных отраслей в обучении. Процессор-коммутатор поддерживает интерфейс PCIe5.0x32, обеспечивая высокую пропускную способность связи. Кроме того, он предлагает несколько конфигураций жестких дисков, эффективно удовлетворяя потребности в локальном кэшировании данных для обучения моделей.
Помимо аппаратной поддержки, Gooxi предлагает комплексные отраслевые решения. AI Private Solution объединяет платформу для разработки ИИ, стек программного обеспечения для ускорения ИИ, оркестровку ресурсов и планирование, а также инфраструктуру ИИ, охватывающую вычислительные системы, сети и хранилища.
Это комплексное решение повышает эффективность и надежность разработки крупных моделей, помогая предприятиям достичь цифровой трансформации и интеллектуальной модернизации.