Mô tả công việc
Bạn sẽ làm việc trực tiếp cùng Tech Lead để giải quyết các bài toán chuyên sâu:
Xây dựng mô hình AI đa phương thức: Tham gia xây dựng và tối ưu mô hình nhận diện cảm xúc từ dữ liệu Text, Audio và Video (kết hợp ASR, NLP, Multimodal Learning).
Phát triển Real-time Pipeline: Thiết kế và triển khai luồng xử lý dữ liệu thời gian thực: Input (Audio/Stream) → Trích xuất đặc trưng (Feature Extraction) → Model → Inference, đảm bảo tốc độ phản hồi tức thì cho Chatbot/Voicebot.
Tiếp nhận & Tinh chỉnh (Fine-tune): Sử dụng Core Engine có sẵn, thực hiện huấn luyện lại trên dữ liệu đặc thù ngành Tài chính/Bảo hiểm để tăng độ chính xác.
Tích hợp hệ thống: Đóng gói model và phối hợp với team Backend để tích hợp các tính năng thông minh vào hệ thống CRM
phục vụ kinh doanh.
Yêu cầu
Kiến thức & Kỹ năng :
Nền tảng: Có kiến thức vững chắc về Machine Learning/Deep Learning, đặc biệt là NLP và Speech Processing.
Công cụ: Thành thạo Python và một trong các Framework: PyTorch hoặc TensorFlow.
Kiến trúc Model: Hiểu biết về kiến trúc Transformer (BERT, Wav2Vec...) và các kỹ thuật Multimodal Fusion (kết hợp dữ liệu đa phương thức).
Điểm cộng lớn (Ưu tiên):
Có kinh nghiệm hoặc hiểu biết về quy trình Deploy Production (Docker, Model Serving, API).
Đã từng làm các dự án liên quan đến xử lý Video hoặc Stream dữ liệu.
Quyền lợi
Thu nhập hấp dẫn (20M - 30M), thưởng dự án.
Làm việc trực tiếp trên nền tảng công nghệ tiên tiến có sẵn, không mất thời gian xây dựng từ đầu, Được dẫn dắt trực tiếp bởi các Senior Engineer dày dạn kinh nghiệm.
Hạ tầng Server/GPU mạnh mẽ phục vụ công việc.
Đầy đủ BHXH, phúc lợi, du lịch theo quy định công ty.
Bảo hiểm xã hội, Team building, Du lịch hàng năm
Thông tin khác
Thời gian làm việc
Thứ 2 - Thứ 6 (từ 08:30 đến 17:30)
Thông tin chung
Nơi làm việc
- - Hà Nội: 143 Nguyễn Tuân, Phường Thanh Xuân (quận Thanh Xuân cũ)
Cách thức ứng tuyển
Ứng viên nộp hồ sơ trực tuyến bằng cách bấm nút Ứng tuyển bên dưới:
Hạn nộp: 08/06/2026