I. TỔNG QUAN VAI TRÒ
Là một
Senior Data Engineer, bạn không chỉ đơn thuần là người sử dụng công cụ; bạn là
Kiến trúc sư và Người bảo vệ hệ sinh thái dữ liệu sống còn của chúng tôi.
Trong môi trường On-premise, bạn sẽ nắm quyền kiểm soát "bare-metal" - từ việc tinh chỉnh cách Spark tương tác với các lõi CPU vật lý đến việc điều phối các luồng công việc quy mô lớn thông qua Airflow. Bạn sẽ dẫn dắt quá trình chuyển đổi sang
kiến trúc Data Lakehouse hiện đại, biến sức mạnh phần cứng thô thành một động cơ hiệu suất cao.
Hơn cả hiệu suất, bạn là Người giám hộ tính toàn vẹn của dữ liệu, thực hiện các khung quản trị nghiêm ngặt để đảm bảo dữ liệu luôn là tài sản doanh nghiệp đáng tin cậy, bảo mật và tuân thủ pháp luật.
II. TRÁCH NHIỆM CHÍNH
- Kiến trúc Pipeline Thế hệ mới: Thiết kế và triển khai các đường ống dẫn dữ liệu (ETL/ELT) quy mô Petabyte sử dụng Apache Spark, Kafka và các công nghệ Lakehouse (Iceberg/Hudi/Delta Lake).
- Điều phối Hệ thống Trọng yếu: Xây dựng kiến trúc workflow có tính sẵn sàng cao trong Apache Airflow, đảm bảo lập lịch thông suốt cho hàng ngàn tác vụ đồng thời.
- Tối ưu hóa Hiệu năng Phần cứng: Làm chủ nghệ thuật tối ưu hóa bằng cách tinh chỉnh các job Spark để hoạt động tối ưu trong giới hạn tài nguyên vật lý (Memory, I/O, Network bandwidth).
- Quản trị & Chất lượng Dữ liệu:
- Thiết lập tiêu chuẩn Data Quality bằng các framework như Great Expectations hoặc dbt Test.
- Triển khai Metadata Management và Data Lineage (Open Lineage) để minh bạch hóa dòng chảy dữ liệu.
- Đảm bảo mọi quy trình dữ liệu tuân thủ nghiêm ngặt Nghị định 13 (PDPD) về bảo vệ dữ liệu cá nhân.
- Bảo mật Doanh nghiệp: Thực hiện kiểm soát truy cập phân quyền chi tiết, mã hóa dữ liệu thông qua Apache Ranger và Kerberos.
- Lưu trữ Thống nhất & OLAP: Thiết kế bố cục dữ liệu bền bỉ trên HDFS/MinIO và quản lý các hệ thống OLAP (Clickhouse/Starrocks) phục vụ phân tích tốc độ cao.
- Kiến trúc dữ liêu: Có kinh nghiêm với các mô hình dữ liệu như Data Vault 2.0 hoặc tương đương.
III. YÊU CẦU NĂNG LỰC
Kinh nghiệm thực chiến
- Hơn 3 năm kinh nghiệm đối với junior và hơn 5 năm kinh nghiệm với Senior. Làm việc trong môi trường Big Data xử lý hàng Terabytes đến Petabytes.
- Có khả năng xử lý sự cố khi hệ thống chạm ngưỡng giới hạn vật lý.
Hệ sinh thái Mã nguồn mở
- Processing: Chuyên gia Spark (Internal, Shuffle tuning, Data Skew mitigation).
- Orchestration: Kinh nghiệm sâu với Airflow (Custom Operators, Celery/K8s Executors).
- OLAP & Query: Thành thạo Trino, Clickhouse hoặc Starrocks.
- Governance & Security: Apache Atlas, Apache Ranger, hoặc DataHub/Amundsen.
Kỹ năng Kỹ thuật Cốt lõi
- Ngôn ngữ: Thành thạo Python hoặc Scala; kỹ năng SQL cấp độ chuyên gia (Black-belt).
- Infrastructure: Hiểu sâu về Linux internals, On-prem networking, YARN/Kubernetes.
- Database: Kiến thức sâu về RDBMS (Oracle, SQL Server, PostgreSQL, MySQL) và NoSQL (MongoDB).
- YÊU CẦU BẮT BUỘC & HỌC VẤN
- Tốt nghiệp Cử nhân chuyên ngành Công nghệ thông tin, Khoa học máy tính, Phát triển ứng dụng phân tán hoặc các lĩnh vực liên quan.
- Tư duy logic mạnh mẽ, khả năng giải quyết vấn đề và chủ động nghiên cứu công nghệ mới.
- Độ tuổi: Độ tuổi dưới 35 tuổi.
- Điểm cộng: Có kinh nghiệm với các nền tảng Cloud (AWS, Azure, hoặc GCP) để hỗ trợ chiến lược Hybrid-Cloud trong tương lai.
IV. QUYỀN LỢI:
1. Thu nhập
- Mức lương cứng: Cạnh tranh theo năng lực; Thưởng Quý, năm và 13: Hấp dẫn, dựa trên kết quả và hiệu quả công việc.
2. Chế độ làm việc và đãi ngộ
- Thời gian làm việc: 8h30 - 17h30, Thứ Hai - Thứ Sáu (nghỉ Thứ Bảy & Chủ nhật).
- Tham gia các chương trình đào tạo, nâng cao kỹ năng chuyên môn.
- Chính sách bảo hiểm sức khỏe, bảo hiểm xã hội theo quy định của Nhà nước.
- Gói bảo hiểm sức khỏe mở rộng dành riêng cho CBNV VietCredit
- Chính sách phúc lợi: Hiếu hỷ, nghỉ phép năm, phép thâm niên
- Thưởng,liên hoan các dịp lễ: Tết, 8/3, 30/4 &1/5, 1/6, Trung thu,2/9, 20/10,19/11...
- Du lịch nghỉ mát 2 lần/năm
- Câu lạc bộ thể thao & teabreak hằng tuần