- Về dự án C-Agent
C-Agent là nền tảng quản lý tri thức và ứng dụng GenAI dành cho doanh nghiệp Việt Nam, giúp doanh nghiệp tự động hóa trả lời, tổ chức dữ liệu và xây dựng hệ tri thức nội bộ. Chúng tôi đang mở rộng hệ thống thu thập & xử lý dữ liệu lớn để
phục vụ các mô hình ngôn ngữ (LLM) và công cụ chatbot AI chuyên sâu.
- Mục tiêu vị trí
Bạn sẽ đóng vai trò trung tâm trong việc xây dựng pipeline dữ liệu phục vụ cho các mô hình AI trong C-Agent. Vị trí này sẽ đảm nhận thiết kế, triển khai và tối ưu hệ thống ingest & xử lý dữ liệu theo thời gian thực, đảm bảo độ sạch, khả năng mở rộng và hiệu suất cao.
I. MÔ TẢ CÔNG VIỆC
Thiết kế & triển khai data pipeline (ETL/ELT) từ nhiều nguồn (API, file, DB, cloud)
Tích hợp dữ liệu trực tiếp vào hệ thống retrieval AI, phục vụ cho câu hỏi từ người dùng
Làm việc với hệ thống lưu trữ file streaming (hiện tại trên S3, cần mở rộng ra hệ thống on-prem)
Phân tích và đề xuất
kiến trúc dữ liệu tối ưu cho hệ thống có thể mở rộng
Phối hợp chặt chẽ với các AI Engineers,
Backend Developers, PM, BA để hiểu nghiệp vụ và triển khai giải pháp phù hợp
Làm sạch dữ liệu, tổ chức metadata và hỗ trợ hệ thống truy vấn theo yêu cầu từ chatbot