Vị trí công việc này hiện tại đã hết hạn nộp hồ sơ, bạn có thể tham khảo thêm một số công việc liên quan phía dưới
Mô tả công việc
Xây dựng và phát triển hệ thống ETL/ELT pipelines
phục vụ xử lý dữ liệu lớn.
Triển khai giải pháp CDC (Change Data Capture) từ các hệ thống ERP/CRM.
Thiết kế và quản lý Data Lakehouse (Bronze/Silver/Gold layers) với Iceberg/Delta Lake.
Thực hiện chuyển đổi dữ liệu bằng dbt, xây dựng mô hình dữ liệu, lớp chỉ số, kiểm thử chất lượng dữ liệu.
Đảm bảo chất lượng và tính toàn vẹn dữ liệu thông qua kiểm thử (Great Expectations, schema validation).
Phân tích và xây dựng mô hình dữ liệu cho lĩnh vực FMCG: bán hàng, phân phối, trade promotion.
Yêu cầu
Thành thạo Python (Pandas, Polars, PySpark) và SQL nâng cao (PostgreSQL, ClickHouse).
Kinh nghiệm làm việc với Kafka/Redpanda, Flink/Spark Streaming.
Có kiến thức về Airflow/Prefect, MinIO/S3, Parquet optimization.
Hiểu biết về API (REST/Webhook) để tích hợp DMS.
Ưu tiên ứng viên có kinh nghiệm trong ngành FMCG.
Tư duy logic, cẩn thận, chủ động học hỏi công nghệ mới.
Quyền lợi
Mức lương cạnh tranh, thỏa thuận theo năng lực.
Tham gia đầy đủ BHXH, BHYT, BHTN.
Môi trường làm việc năng động, cơ hội tiếp cận công nghệ dữ liệu mới nhất.
Được đào tạo, nâng cao kỹ năng chuyên môn, cơ hội thăng tiến rõ ràng.
Thông tin khác
Địa điểm làm việc
TP.HCM:18A, Đường số 3, Phướng An Khánh, Thủ Đức
Thông tin chung
- Ngày hết hạn: [protected info]
- Thu nhập: 20 - 30 triệu