
28.12.2023 13:22
PostgresML: Бібліотека з відкритим вихідним кодом, яка спрощує машинне навчання
Інженери машинного навчання часто стикаються з проблемою створення складної інфраструктури для управління моделями. Це може бути пов’язано з налаштуванням мікросервісів, навчанням та розгортанням моделей, а також іншими завданнями. Така складність може бути перешкодою для ефективного машинного навчання.
Існують рішення для управління моделями машинного навчання, але вони часто вимагають складних конфігурацій і зовнішніх залежностей. Ці рішення передбачають налаштування окремих сервісів і баз даних, що додає додатковий рівень складності до робочого процесу машинного навчання.
PostgresML — це бібліотека з відкритим вихідним кодом, яка інтегрується з PostgreSQL, надійною і широко використовуваною реляційною базою даних. PostgresML розширює PostgreSQL, перетворюючи її на комплексну платформу для машинного навчання.
Основні переваги PostgresML:
- Можливість навчати та розгортати моделі ML безпосередньо в базі даних за допомогою стандартних SQL-запитів.
- Підтримка виведення на графічному процесорі для прогнозування з низькою затримкою і підтримки потокової відповіді для великих мовних моделей.
- Керування моделями ML з відкритим вихідним кодом з таких платформ, як HuggingFace.
- Підтримка навчання табличних даних за більш ніж 50 алгоритмами, включаючи випадкові ліси та нейронні мережі.
- Створення та індексування векторних вбудовувань для текстового пошуку та рекомендацій.
- Горизонтальна масштабованість для мільйонів прогнозів в секунду.
PostgresML значно спрощує конвеєр операцій машинного навчання (MLOps). Він дозволяє плавно переходити від навчання моделі до промислового розгортання за допомогою простих SQL-запитів. Консолідація конвеєра даних моделі в PostgreSQL підвищує операційну ефективність і забезпечує швидке розуміння, тримаючи моделі ближче до даних і додатків.
Нагадаємо, дослідники з Чжецзянського університету створили TableGPT, розширюючи межі можливого при використанні підходів LLM для аналізу даних.