Mô tả công việc
Nghiên cứu, đánh giá và cập nhật liên tục các xu hướng, mô hình và kỹ thuật mới nhất trong lĩnh vực Natural Language Processing (NLP), Computer Vision (CV) và Generative AI,
phục vụ các sản phẩm chuyển đổi số và hệ thống AI nội bộ.
Thiết kế, phát triển và tối ưu hóa các Large Language Model (LLMs) và Multimodal Large Language Models (MLLMs) cho nhiều bài toán thực tế, bao gồm nhưng không giới hạn:
Retrieval-Augmented Generation (RAG)
Chatbot/Virtual Assistant
Document Understanding, Information Extraction
Text Classification, Summarization, Question Answering
Xây dựng và tối ưu pipeline fine-tuning, instruction-tuning, preference tuning cho LLMs (SFT, LoRA/QLoRA, PEFT, RL).
Làm việc với các mô hình mã nguồn mở và thương mại như LLaMA, DeepSeek, Qwen, Mistral, kết hợp với Vector Database để xây dựng hệ thống tìm kiếm ngữ nghĩa và RAG ở quy mô lớn.
Thiết kế và tối ưu embedding pipelines, vector indexing, retrieval strategy (hybrid search, reranking).
Đánh giá, phân tích và cải thiện hiệu suất mô hình theo các tiêu chí:
Accuracy, latency, throughput, memory footprint
Hallucination, factuality, robustness
Phối hợp với các nhóm Backend, Data, DevOps để:
Tích hợp mô hình AI vào hệ thống sản phẩm
Triển khai mô hình ở môi trường production (on-premise hoặc cloud)
Thực hiện tài liệu hóa kỹ thuật, báo cáo nghiên cứu và báo cáo tiến độ theo yêu cầu của ban quản lý.
Phát triển và triển khai các hệ thống Speech AI, bao gồm:
Automatic Speech Recognition (ASR) với Whisper, WhisperX, Wav2Vec2
Alignment, diarization và hậu xử lý dữ liệu âm thanh
Yêu cầu
Kiến thức & Kỹ năng chuyên môn
Thành thạo các framework và thư viện học sâu:
PyTorch (ưu tiên), TensorFlow
Hugging Face (Transformers, Datasets, PEFT, Accelerate)
Nắm vững các nền tảng và khái niệm cốt lõi của NLP hiện đại:
Word / Sentence / Document Embeddings
Transformer, Attention Mechanism
Sequence-to-Sequence & Decoder-only Models
Tokenization, context length, prompt engineering
Có kinh nghiệm xử lý dữ liệu NLP quy mô lớn:
Data cleaning, normalization, deduplication
Dataset curation cho fine-tuning và evaluation
Có kinh nghiệm thực tế với Vector Databases:
Milvus, Weaviate, Chroma, FAISS
Hiểu rõ embedding dimension, indexing strategy, recall-latency tradeoff
Có kinh nghiệm làm việc với LLMs mã nguồn mở:
LLaMA, Mixtral, DeepSeek, Qwen, Mistral hoặc tương đương
Hiểu biết về các kỹ thuật tối ưu và triển khai mô hình:
Quantization (INT8, INT4, FP8)
Model parallelism, inference optimization
vLLM, Triton, TensorRT-LLM
Kỹ năng bổ trợ
Có tư duy nghiên cứu, khả năng đọc - phân tích paper, benchmark và mã nguồn.
Có kinh nghiệm triển khai mô hình trong môi trường production là một lợi thế:
REST/gRPC API
Docker, Kubernetes
Có khả năng đọc hiểu và viết tài liệu kỹ thuật bằng tiếng Anh.
Phẩm chất cá nhân
Tinh thần chủ động, ham học hỏi và sẵn sàng cập nhật công nghệ mới.
Khả năng làm việc độc lập và phối hợp nhóm tốt.
Tư duy hệ thống, chú trọng chất lượng và khả năng mở rộng của giải pháp.
Quyền lợi
Thu nhập hấp dẫn theo năng lực
Bảo hiểm sức khỏe và các chương trình, chế độ phúc lợi của Tập đoàn CMC (ngày nghỉ sinh nhật, thưởng các dịp lễ/tết/sinh nhật Tập đoàn,...) cùng các chế độ BHXH, BHYT,v.v theo quy định Pháp luật
Thưởng hiệu quả công việc, đánh giá năng lực, review lương hàng năm
Cơ hội học hỏi, tham gia đào tạo và phát triển bản thân tại một Tập đoàn công nghệ lớn hàng đầu Việt Nam, với lộ trình thăng tiến nghề nghiệp rõ ràng
Môi trường làm việc trẻ trung, năng động, cởi mở, sáng tạo, đồng nghiệp vui vẻ và luôn được tạo cơ hội tiếp cận những công nghệ mới, tiên tiến nhất
Thông tin khác
Thời gian làm việc
Thứ 2 - Thứ 6 (từ 08:30 đến 18:00)
Thứ 2- Thứ 6, nghỉ trưa từ 12h - 13h30
Thông tin chung
Nơi làm việc
- - Hà Nội: Tòa CMC, 11 Duy Tân, Cầu Giấy, Phường Cầu Giấy (quận Cầu Giấy cũ)
Cách thức ứng tuyển
Ứng viên nộp hồ sơ trực tuyến bằng cách bấm nút Ứng tuyển bên dưới:
Hạn nộp: 03/05/2026