* Mục tiêu vai trò: Xây dựng và vận hành pipeline dữ liệu ổn định, chính xác, có khả năng mở rộng,
phục vụ báo cáo, phân tích và AI.
* Trách nhiệm chính:
Thiết kế, phát triển và tối ưu ETL/ELT pipeline.
Kết nối dữ liệu từ app, web, CRM, ERP, đối tác và các nguồn nội bộ.
Xây dựng, duy trì data warehouse/lakehouse và chuẩn hóa dữ liệu đầu ra.
Theo dõi chất lượng dữ liệu, giám sát pipeline, xử lý lỗi và tối ưu hiệu năng.
Phối hợp với BI, AI, BA để đảm bảo dữ liệu đúng logic nghiệp vụ.
3-5 năm kinh nghiệm ở vị trí Data Engineer.
Tốt nghiệp CNTT, Khoa học dữ liệu, Hệ thống thông tin hoặc ngành liên quan.
Có kinh nghiệm làm việc với hệ thống dữ liệu quy mô vừa hoặc lớn.
Ưu tiên đã triển khai cả pipeline batch và streaming.
SQL rất tốt; Python hoặc Scala tốt.
Kinh nghiệm với Airflow, Spark; dbt là lợi thế.
Hiểu data modeling, star schema, fact-dimension, partitioning, optimization.
Có kinh nghiệm với BigQuery, Snowflake, Redshift, Databricks hoặc tương đương.
Tư duy hệ thống, root-cause analysis, cẩn trọng với logic dữ liệu.
Có kinh nghiệm hệ thống dữ liệu lớn Y tế là lợi thế