Mô tả công việc
Mô tả Công việc
- Tham gia phân tích, thiết kế, phát triển các ứng dụng theo yêu cầu của công ty;
- Phối hợp hỗ trợ với các bộ phận khác để triển khai hệ thống cho khách hàng;
- Nghiên cứu và phát triển các thuật toán Xử lý tiếng nói: xoá/lọc nhiễu, nhận dạng tiếng nói, tổng hợp tiếng nói, nhận diện người nói, tách giọng (Speaker Diarization)
- Xây dựng mô hình âm học (acoustic model), mô hình ngôn ngữ (language model), decoder, tối ưu hoá từ điển, ...
- Nghiên cứu và phát triển các mô hình Nhận dạng tiếng nói dựa trên neural networks
- Nghiên cứu và xây dựng các bộ cơ sở dữ liệu huấn luyện từ vựng lớn đảm bảo độ phủ về chất giọng vùng miền, độ tuổi, giới tính, môi trường, ... phù hợp với từng bài toán cụ thể.
- Nghiên cứu và phát triển các mô hình học máy cho Tổng hợp tiếng nói, voice clone, voice converter... dựa trên các mô hình như FastSpeech2, F5-TTS, ...
- Báo cáo công việc định kỳ cho trưởng nhóm;
- Công việc sẽ được trao đổi cụ thể hơn trong quá trình phỏng vấn.
Yêu cầu
Yêu Cầu Công Việc
- Tốt nghiệp đại học chuyên ngành Công nghệ thông tin, Toán tin.
- Có kiến thức về các thuật toán Machine Learning (Classification, Regression), Neural Network
- Thành thạo một trong các framework: Scikit-learn, Keras , Tensorflow, PyTorch...
- Lập trình hướng đối tượng thành thạo với một trong các ngôn ngữ sau : C++/C, Python, Java
- Có khả năng nghiên cứu công nghệ mới với nền tảng cấu trúc dữ liệu và Thuật toán tốt.
- Nắm được các kiến thức cơ bản về Xử lý tín hiệu số, cơ sở Toán học cho Xử lý tín hiệu số (Fast Fourier Transform, spectrogram, trích chọn đặc trưng tín hiệu, sử dụng bộ lọc tín hiệu, ...)
- Nắm được các kiến thức cơ bản về xây dựng các mô hình Nhận diện / Tổng hợp tiếng nói (acoustic model, language model, ...)
- Có kiến thức cơ bản về học máy, nắm được các mô hình cơ bản thường dùng trong Xử lý tiếng nói : HMM, DNN, CNN, Transformers, ...
- Có kiến thức cơ bản về học máy với mô hình mạng nơ-ron (neural networks), các mô hình seq2seq, ...
- Có kinh nghiệm sử dụng các framework/toolkit cho Nhận diện tiếng nói như : Kaldi, K2, Speechbrain, ...
- Kĩ năng làm việc theo nhóm, làm việc độc lập;
- Đọc, hiểu tài liệu kỹ thuật tiếng Anh chuyên ngành.
- Chịu khó tìm tòi và nghiêm túc trong công việc.
- Chủ động trong công việc cũng như tìm hiểu công nghệ mới.
- Có trách nhiệm cao với công việc, gắn bó lâu dài với công ty.
Quyền lợi
Laptop
Chế độ bảo hiểm
Du Lịch
Phụ cấp
Du lịch nước ngoài
Đồng phục
Chế độ thưởng
Chăm sóc sức khỏe
Đào tạo
Tăng lương
Công tác phí
CLB thể thao
Thông tin chung
Nơi làm việc
- 22 Láng Hạ, Láng Hạ, Đống Đa, Hà Nội
Cách thức ứng tuyển
Ứng viên nộp hồ sơ trực tuyến bằng cách bấm nút Ứng tuyển bên dưới:
Hạn nộp: 31/12/2025