Vị trí công việc này hiện tại đã hết hạn nộp hồ sơ, bạn có thể tham khảo thêm một số công việc tương tự tại đây:
Mô tả công việc
Xử lý và phân tích file VCF ([protected info], [protected info].tbi) bằng pysam hoặc cyvcf2, chuẩn hóa dữ liệu với VEP hoặc ANNOVAR.
Tạo embedding và quản lý vector store (FAISS, Pinecone, hoặc Weaviate) cho dữ liệu genome.
Tích hợp và tối ưu hóa pipeline RAG với LangChain hoặc LlamaIndex cùng LLM (OpenAI GPT, LLaMA3, hoặc Mistral).
Hỗ trợ triển khai và kiểm thử trên AWS (S3, Lambda).
Yêu cầu
Tối thiểu 2-3 năm kinh nghiệm trong AI/ML, ưu tiên với dự án RAG hoặc xử lý dữ liệu genome.
Thành thạo Python, có kinh nghiệm với VCF file và các công cụ như pysam, cyvcf2
Hiểu biết về vector database (FAISS, Pinecone) và mô hình ngôn ngữ lớn (LLM).
Kiến thức cơ bản về AWS (S3, Lambda) là một lợi thế.
Ưu tiên ứng viên có kinh nghiệm với LangChain, LlamaIndex, hoặc các thư viện embedding (sentence-transformers).
Quyền lợi
Lương cao thỏa thuận theo năng lực và tinh thần làm việc
Review lương 1-2 lần/ 1 năm
Thưởng tết, quà sinh nhật, cafe, đồ ăn, trang thiết bị làm việc đầy đủ
BHXH và phép năm theo luật lao động
Môi trường thân thiện, hòa đồng
Thời gian làm việc: T2-T6: [protected info]
Địa chỉ: Căn B1 D 'Verano, Đường N6, Khu dân cư Thủ Thiêm Lakeview, Phường An Khánh, Thành phố Hồ Chí Minh, Việt Nam
Thông tin chung
- Ngày hết hạn: [protected info]
- Thu nhập: Thỏa thuận