Aimesoft : Multimodal Artificial Intelligence
Aimesoft is a Multimodal AI research and development company.
Tuyển dụng Kỹ sư phần mềm Xử lý tiếng nói
Công ty Phần mềm Aimesoft cần tuyển nhân sự cho vị trí Kỹ sư nghiên cứu và phát triển phần mềm Xử lý tiếng nói (Speech Processing Engineer).
Thông tin chung:
Aimesoft là công ty chuyên nghiên cứu, phát triển và cung cấp các phần mềm dựa trên Trí tuệ nhân tạo đa thể thức. Aimesoft được sáng lập bởi các chuyên gia về Trí tuệ nhân tạo, Xử lý ảnh, Xử lý ngôn ngữ tự nhiên ở Tokyo, Nhật Bản. Aimesoft có trụ sở tại Hà Nội, Việt Nam và San Francisco, Hoa Kỳ.
Mô tả công việc :
- Nghiên cứu và phát triển các thuật toán Xử lý tiếng nói : xoá/lọc nhiễu, nhận diện tiếng nói, tổng hợp tiếng nói, nhận diện người nói, tách tiếng (Speaker Diarization), dịch trực tiếp tiếng nói cho tiếng Nhật, Anh, Việt.
- Nghiên cứu và phát triển các mô hình học máy cho Nhận diện tiếng nói, xây dựng mô hình âm học (acoustic model), mô hình ngôn ngữ (language model), decoder, tối ưu hoá từ điển, ...
- Nghiên cứu và phát triển các mô hình Nhận dạng tiếng nói dựa trên neural networks
- Nghiên cứu và xây dựng các bộ cơ sở dữ liệu huấn luyện từ vựng lớn đảm bảo độ phủ về chất giọng vùng miền, độ tuổi, giới tính, môi trường... phù hợp với từng bài toán cụ thể.
- Nghiên cứu và phát triển các mô hình học máy cho Tổng hợp tiếng nói, voice clone, voice converter... dựa trên các mô hình như HMM, DNN.
- Nghiên cứu và phát triển các mô hình học máy phục vụ việc tách nguồn (source separation), tách tiếng (speaker diarization), nhận diện người nói, thời điểm nói, thứ tự câu nói.
Yêu cầu:
- Nắm được các kiến thức cơ bản về Xử lý tín hiệu số, cơ sở Toán học cho Xử lý tín hiệu số (Fast Fourier Transform, spectrogram, trích chọn đặc trưng tín hiệu, sử dụng bộ lọc tín hiệu, ...)
- Nắm được các kiến thức cơ bản về xây dựng các mô hình Nhận diện / Tổng hợp tiếng nói (acoustic model, language model, feature bank, ...)
- Có kiến thức cơ bản về học máy, nắm được các mô hình cơ bản thường dùng trong Xử lý tiếng nói : HMM, DNN, DTW.
- Có kiến thức cơ bản về học máy với mô hình mạng nơ-ron (neural networks), các mô hình seq2seq, ...
- Hiểu biết về một trong các lĩnh vực sau của Xử lý tiếng nói : nhận diện tiếng nói (automatic speech recognition), tổng hợp tiếng nói (speech synthesis), nhận diện người nói (speaker identification/verification), tách tiếng, tách nguồn, xây dựng mô hình âm học (acoustic model), xây dựng từ điển âm học (grapheme-to-phoneme conversion).
- Có kinh nghiệm sử dụng các framework/toolkit cho Nhận diện tiếng nói như : Kaldi, Sphinx, Julius, HTK ...
- Lập trình hướng đối tượng thành thạo với một trong các ngôn ngữ sau : C++/C, Python, Java
- Tốt nghiệp đại học chuyên ngành Khoa học máy tính, Công nghệ thông tin, Điện tử viễn thông hoặc có trình độ tương đương (ưu tiên các ứng viên tốt nghiệp Thạc sỹ, Tiến sỹ)
- Ưu tiên các ứng viên có kinh nghiệm nghiên cứu, có khả năng đọc paper của ngành Xử lý tiếng nói (như các paper của ICASSP, INTERSPEECH, TASLP, ...)
Quyền lợi :
- Làm việc trong môi trường chuyên nghiệp, năng động, sáng tạo, với các chuyên gia hàng đầu về Nhận diện tiếng nói, Tổng hợp tiếng nói
- Mức lương tương xứng, cạnh tranh
- Phụ cấp ăn trưa
Qui trình dự tuyển:
- Bước 1: Gửi email đính kèm CV đến với tiêu đề
"Dự tuyển vị trí Kỹ sư phần mềm Xử lý ảnh (Tên bạn)"
(hãy thay phần "Tên bạn" bằng tên đầy đủ của bạn).
Trong nội dung email hãy ghi tên, trường tốt nghiệp, khoa tốt nghiệp, công việc hiện tại của bạn (sinh viên, đã đi làm, ...), mức lương mong muốn và các thông bạn muốn cho chúng tôi biết. - Bước 2 (nếu có): phỏng vấn
Ngày đăng tin (cập nhật): 22/05/2019
Address : 3F, Hoang Ngoc building, No. 4, Ln. 82 Dich Vong Hau street, Cau Giay, Hanoi, Vietnam
Phone : [protected info]
Email : [protected info]
Copyright (C) 2018, Aimesoft JSC.