Nghiên cứu và phát triển hệ thống chuyển đổi giọng nói thành văn bản (Speech-to-Text), đảm bảo độ chính xác cao trong ngữ cảnh hội thoại
chăm sóc khách hàng.
Xây dựng các thuật toán template matching để so khớp nội dung văn bản với các mẫu template, bao gồm các chỉ số đo lường mức độ khớp (cosine similarity, Levenshtein distance, v.v.).
Tối ưu hóa hệ thống AI/NLP để xử lý các yếu tố như nhiễu âm thanh, ngữ điệu và giọng vùng miền.
Làm việc với các dịch vụ đám mây như Google Cloud Speech-to-Text, AWS Transcribe, hoặc các mô hình mã nguồn mở như DeepSpeech, Whisper.
Hợp tác với các bộ phận khác để tích hợp mô-đun AI vào hệ thống phần mềm tổng thể.
Nghiên cứu và ứng dụng các mô hình NLP tiên tiến như transformers (BERT, GPT) hoặc seq2seq models để phân tích và xử lý văn bản.
Đánh giá và tối ưu hóa hiệu suất của hệ thống bằng các chỉ số như Word Error Rate (WER), Precision, và Recall. Thực hiện phân tích dữ liệu để cải thiện chất lượng hệ thống dựa trên feedback từ người dùng thực tế.
Bằng cấp: Tốt nghiệp đại học chuyên ngành Khoa học Máy tính, Kỹ thuật Phần mềm, Toán-Tin, hoặc lĩnh vực liên quan.
Kinh nghiệm: Có ít nhất 2-3 năm kinh nghiệm làm việc với các hệ thống AI/Machine Learning, đặc biệt trong lĩnh vực Speech-to-Text hoặc NLP.
Kinh nghiệm triển khai các mô hình machine learning trên các nền tảng đám mây như Google Cloud, AWS, hoặc Azure.
Kỹ năng chuyên môn:
Thành thạo một hoặc nhiều ngôn ngữ lập trình như Python, R, hoặc Java.
Hiểu biết sâu về Deep Learning Frameworks: TensorFlow, PyTorch, Keras.
Thành thạo các công cụ và thư viện NLP như spaCy, NLTK, Hugging Face Transformers.
Có kinh nghiệm xử lý tín hiệu âm thanh (speech processing) với LibROSA, PyDub, hoặc các công cụ tương tự.
Hiểu biết về các phương pháp đánh giá văn bản và đo lường độ khớp (similarity metrics).
Ưu tiên: Kinh nghiệm làm việc với dữ liệu tiếng Việt hoặc xử lý ngôn ngữ tự nhiên cho các ngôn ngữ có đặc thù vùng miền.
Hiểu biết về các mô hình tiên tiến như Whisper, Wav2Vec 2.0, hoặc các mô hình mã nguồn mở khác.
Kinh nghiệm xử lý dữ liệu lớn và triển khai các hệ thống AI trên môi trường production