Компания Nvidia представила новую модель искусственного интеллекта с открытым исходным кодом, которая демонстрирует производительность в задачах визуализации и обработки естественного языка, конкурируя с фирменными системами лидеров отрасли, такими как OpenAI и Google.
Новое семейство больших мультимодальных языковых моделей NVLM 1.0, возглавляемое 72-миллиардной параметрической моделью NVLM-D-72B, расширяет возможности работы с текстом и демонстрирует впечатляющую адаптивность при обработке сложных визуальных и текстовых входов.
По словам исследователей, NVLM-D-72B улучшает свою производительность в текстовых задачах после мультимодального обучения, увеличивая точность в среднем на 4,3 балла по ключевым текстовым бенчмаркам. Это значительное улучшение по сравнению с текстовой основой в тестах по математике и кодированию, проводимых исключительно с текстовыми данными.