Research Engineer Large Language Model (LLM) Pretraining

CÔNG TY CỔ PHẦN VINSMART FUTURE

Thương lượng
14/12/2025
Toàn thời gian

Mô tả công việc

Key Responsibilities
1. Data Engineering for Pretraining
• Build and maintain scalable pipelines for text collection, cleaning, deduplication, filtering, and quality scoring.
• Process large-scale Vietnamese and multilingual datasets.
• Implement tokenization workflows, corpus sharding, mixture sampling, and dataset balancing.
• Develop automated dataset validation and quality assurance tools.
2. Model Training & Optimization
• Support distributed training of LLMs using DeepSpeed, Megatron-LM, FSDP, or similar.
• Optimize throughput, memory efficiency, and multi-node GPU performance.
• Run full-scale LLM experiments and troubleshoot training issues.
• Conduct model fine-tuning, instruction tuning, and alignment if needed.
3. Infrastructure & Engineering
• Work with multi-GPU/multi-node clusters using Slurm, Docker/Singularity.
• Maintain experiment tracking pipelines.
• Develop reusable tools for logging, checkpointing, and evaluations.
4. Evaluation & Benchmarking
• Prepare and maintain Vietnamese and multilingual benchmark suites.
• Implement automated evaluation pipelines.
• Analyze results to guide improvements.

Yêu cầu

Minimum Requirements
• Bachelor's/Master's/PhD's degree in CS/AI/ML or related fields.
• Strong Python programming and PyTorch experience.
• Understanding of transformer architectures and tokenization.
• Experience with GPU clusters, Linux, Bash.
• Familiarity with distributed training frameworks.
Preferred Qualifications
• Experience with large-scale datasets.
• Knowledge of Vietnamese NLP.
• Experience with MoE, long-context models, deduplication.
• Open-source contributions.
• Experience with quantization, distillation, compression.

Quyền lợi

Thưởng
Attractive salary & bonus
Chăm sóc sức khoẻ
Premium healthcare
Khác
Opportunity to build next-generation Vietnamese LLMs.
Access to large GPU clusters.
High-growth environment bridging research and product.
Collaboration with strong AI teams.
Competitive compensation.

Thông tin khác

NGÀY ĐĂNG
14/11/2025
CẤP BẬC
Nhân viên
NGÀNH NGHỀ
Giáo Dục > Nghiên Cứu Học Thuật
KỸ NĂNG
Python Programming, PyTorch, Transformer Architectures, Gpu Clusters, Vietnamese Nlp
LĨNH VỰC
Khác
NGÔN NGỮ TRÌNH BÀY HỒ SƠ
Bất kỳ
SỐ NĂM KINH NGHIỆM TỐI THIỂU
3
QUỐC TỊCH
Không giới hạn
Xem thêm

Thông tin chung

  • Thu nhập: Thương lượng

Nơi làm việc

  • Vincom Center Đồng Khởi, Lê Thánh Tôn, Phường, Bến Nghé, Quận 1, Thành phố Hồ Chí Minh, Việt Nam
  • 7th Floor, Technopark Tower, Vinhomes Ocean Park 1, Gia Lam District, Hanoi

Việc làm tương tự

Lập trình viên Backend

CÔNG TY CỔ PHẦN GIẢI PHÁP THANH TOÁN VIỆT NAM (VNPAY)

Cạnh tranh
Hà Nội
31/12/2025

Python Developer Webapp

Công ty Cổ phần LitGroup

8.000.000 - 15.000.000 VND
Hà Nội
24/12/2025

Fullstack Developer Python/ ReactJS

Công ty TNHH Mumesoft Innovation

You'll love it
Hà Nội
03/01/2026

Backend Developer Python

Công ty TNHH Bảo hiểm TASCO

Thoả thuận
Hà Nội
01/01/2026

Python Developer (AI / LLM Application)

CÔNG TY TNHH CÔNG NGHỆ AMCOLAB

10 - 20 triệu
Hà Nội
15/12/2025

CAD Developer

TỔNG CÔNG TY VIỄN THÔNG VIETTEL

Thương lượng
Hà Nội, Hồ Chí Minh
20/12/2025

Kỹ Sư Lập Trình Phần Mềm

Tập đoàn Công nghiệp Viễn thông Quân đội

Thoả thuận
Hà Nội
15/12/2025

Lập trình viên

Công ty Cổ phần Công nghệ EUP

15 Tr - 20 Tr VND
Hà Nội
27/12/2025

Power BI Developer Data Analyst, Python, AI

Savills Việt Nam

Cạnh tranh
Hồ Chí Minh
26/12/2025

Cộng Tác Viên Developer (Hợp Đồng 6 Tháng)

CÔNG TY CỔ PHẦN DỊCH VỤ CÔNG NGHỆ TIN HỌC HPT

Thoả thuận
Hồ Chí Minh
24/12/2025
Vị trí Research Engineer Large Language Model (LLM) Pretraining do công ty CÔNG TY CỔ PHẦN VINSMART FUTURE tuyển dụng tại Hà Nội, Hồ Chí Minh, Joboko tự động tổng hợp mức lương Thương lượng, tìm thêm việc làm về Research Engineer Large Language Model (LLM) Pretraining hoặc công ty CÔNG TY CỔ PHẦN VINSMART FUTURE ở các link phía trên

Giới thiệu công ty

CÔNG TY CỔ PHẦN VINSMART FUTURE

Địa chỉ: TechnoPark Tower, Vinhomes Ocean Park, Đa Tốn, Gia Lâm, Hanoi, Việt Nam
Quy mô: Từ 501 - 1000 nhân viên

Việc làm HOT

CÔNG TY TNHH QR CONNECT
15 - 25 triệu VND
Hà Nội, Hồ Chí Minh, Đà Nẵng, Thừa Thiên Huế
Công ty cổ phần JobOKO Toàn cầu
Thỏa thuận
Hà Nội
CÔNG TY CỔ PHẦN X-MEDIA
Hỗ trợ 1.500.000đ - 2.500.000đ/tháng
Hà Nội
CÔNG TY CỔ PHẦN X-MEDIA
10.000.000đ - 12.000.000đ/tháng
Hà Nội
Ngân hàng TMCP Đông Nam Á - SeABank
10 - 20 triệu VND
Hà Nội, Hồ Chí Minh