Mô tả công việc
1. Mô tả công việc
1.1. Thiết kế Kiến trúc & Xây dựng Hệ thống Dữ liệu
• Xây dựng Kiến trúc Tổng thể: Thiết kế và triển khai mô hình Dữ liệu phân tầng (Raw/Staging/Warehouse/Mart) và kiến trúc Lakehouse/DWH phù hợp với quy mô business và bài toán chi phí.
• Thiết kế Data Pipeline: Xây dựng luồng xử lý Batch/Streaming có khả năng mở rộng (Scalability) và dễ bảo trì.
• Chuẩn hóa Dữ liệu: Xây dựng Data Model, định nghĩa Data Contract, Schema Evolution và Naming Convention đồng nhất giữa các hệ thống.
• Chiến lược Lưu trữ: Thiết kế chiến lược lưu trữ tối ưu (Partitioning, Clustering, Indexing) và Vòng đời dữ liệu (Retention, Archival, Compaction).
1.2. Vận hành, Tối ưu hóa & Quản trị Chất lượng
• Đảm bảo Hiệu năng & Chi phí: Tối ưu hóa các script transform (SQL/Python/Spark) để giảm thời gian xử lý (Latency) và kiểm soát chặt chẽ chi phí hạ tầng Cloud (AWS S3, BigQuery, Compute usage).
• Vận hành & Giám sát: Theo dõi hệ thống (Airflow, Spark, dbt, Kafka), xử lý sự cố ETL/Pipeline chậm/failed để đảm bảo dữ liệu cập nhật đúng hạn (Uptime & Reliability).
• Quản trị Dữ liệu: Định nghĩa tiêu chuẩn Data Quality, kiểm tra tính toàn vẹn dữ liệu, và duy trì hệ thống Data Catalog / Data Lineage minh bạch.
• CI/CD: Commit, review và deploy code pipeline qua hệ thống tự động một cách chặt chẽ. Cập nhật schema an toàn.
1.3. Phối hợp Đa phòng ban & Khai phá Dữ liệu Sản phẩm
• Thiết kế Tracking & Event: Phối hợp cùng Product/Business team đề xuất chuẩn Tracking, Event Schema, và Data Flow để đo lường chính xác user behavior, funnel, conversion.
• Xây dựng Lớp phân tích: Đồng bộ với team Backend,
Data Analyst (DA),
Data Scientist (DS) để xây dựng Data Mart / Semantic Layer và định nghĩa các Metrics thống nhất.
• Thúc đẩy Self-service: Xây dựng hệ thống và hạ tầng giúp các team Non-tech có thể tự phục vụ báo cáo và ra quyết định nhanh chóng. Đảm bảo dữ liệu luôn phản ánh đúng Business Logic.
1.4. Nghiên cứu Cải tiến
• Nghiên cứu Công nghệ: Liên tục R&D và xây dựng các bản thử nghiệm áp dụng công nghệ mới (Streaming, Data versioning như Delta, Iceberg...) để nâng cấp hệ thống hiện tại.
• Xây dựng Best Practices: Viết tài liệu
kiến trúc, hướng dẫn kỹ thuật và trực tiếp hỗ trợ các thành viên sử dụng hệ thống dữ liệu.
1.5. Tham gia đóng góp vào mục tiêu chung của Volio
Yêu cầu
2. Yêu cầu ứng viên
2.1. Yêu cầu bắt buộc (Must Have)
Về Kinh nghiệm & Tư duy
• Từ 03 - 05 năm kinh nghiệm ở các lĩnh vực: Data Engineer, Data Architect hoặc các vị trí tương đương xử lý dữ liệu lớn (Big Data)
• Nắm vững kiến trúc dữ liệu, hiểu rõ nguyên lý ETL/ELT, Batch/Streaming processing và phân biệt rõ OLAP vs OLTP.
• Có tư duy về Data Modeling (Normalization, Star schema) và thiết kế SQL Schema.
• Nắm chắc các khái niệm về Data Quality, Cleansing và Data Lineage / Observability
• Hiểu biết sâu về các định dạng lưu trữ dữ liệu (JSON, Parquet, Avro...) và khái niệm Cloud Storage.
Về Công nghệ & Kỹ năng cứng:
• Kỹ năng viết code ETL, validate/kiểm thử dữ liệu và tối ưu hóa câu query (Query & Throughput optimization).
• Thành thạo SQL và Python (đặc biệt là Pandas, PySpark).
• Sử dụng thực chiến các công cụ Data: Apache Spark, Apache Airflow, dbt.
• Có kinh nghiệm thao tác trên các Cloud Data Warehouse (BigQuery, AWS Redshift, hoặc Snowflake).
• Có năng lực phân tích performance, debug data flow và debug hệ thống ETL.
• Có kiến thức về phân quyền và bảo mật an toàn dữ liệu.
Kỹ năng mềm
• Hiểu và từng làm việc theo mô hình Agile/Scrum.
• Kỹ năng quản lý công việc tốt: Biết phân tích, chia nhỏ task, Estimate effort (ước lượng thời gian) chính xác.
• Khả năng R&D và làm PoC (Proof of Concept) nhanh chóng để ứng dụng công nghệ mới.
• Kỹ năng họp hiệu quả, phối hợp mượt mà qua các tool nội bộ
2.2. Ưu tiên (Nice to Have)
• Công nghệ Dữ liệu Hiện đại: Có kinh nghiệm thực tế triển khai kiến trúc Lakehouse và các định dạng bảng mở (Open Table Formats) như Delta Lake, Apache Iceberg, hoặc Apache Hudi.
• Xử lý Thời gian thực: Từng thiết kế hệ thống Streaming Pipeline chịu tải cao với Apache Kafka, Flink, hoặc Pub/Sub.
• Domain Expertise (Game/App): Có hiểu biết về hệ thống Product Analytics Tracking trong ngành Game/Mobile App (như Firebase, Mixpanel, AppsFlyer, Amplitude) là một điểm cộng cực kỳ lớn.
• Hạ tầng & DataOps: Có kinh nghiệm về quản trị chi phí Cloud (FinOps), sử dụng Docker/Kubernetes và viết Infrastructure as Code (Terraform).
• Có kinh nghiệm xây dựng hoặc định nghĩa Semantic Layer và tích hợp với các công cụ BI (Tableau, PowerBI, Metabase, Superset).
Quyền lợi
Nghỉ phép có lương
Nghỉ hưởng lương hàng năm (Mặc định): 12 ngày/ năm, Nghỉ thâm niên, Ngày nghỉ có hưởng lương vào sinh nhật.
Cơ hội du lịch
Du lịch & teambuilding trong & ngoài nước 2 lần/năm
Hoạt động nhóm
Văn phòng nhiều tiện ích hấp dẫn: Bida, Game cầm tay + Góc ẩm thực: Đồ ăn vặt, trà chiều miễn phí thay đổi mỗi ngày
Xem thêm
Thông tin khác
NGÀY ĐĂNG
22/05/2026
CẤP BẬC
Nhân viên
NGÀNH NGHỀ
Công Nghệ Thông Tin/Viễn Thông > Data Engineer/Data Analyst/AI
KỸ NĂNG
Data Science, SQL, Python, Apache Spark, Data Engineering, Data Engineering
LĨNH VỰC
Phần Mềm CNTT/Dịch vụ Phần mềm
NGÔN NGỮ TRÌNH BÀY HỒ SƠ
Bất kỳ
SỐ NĂM KINH NGHIỆM TỐI THIỂU
3
QUỐC TỊCH
Không hiển thị
Xem thêm
Thông tin chung
- Thu nhập: Tới 50tr ₫/tháng
Nơi làm việc
- Sảnh văn phòng, toà nhà Stellar Garden, 104 Nguỵ Như Kon Tum, Thanh Xuân, Hà Nội
Cách thức ứng tuyển
Ứng viên nộp hồ sơ trực tuyến bằng cách bấm nút Ứng tuyển bên dưới:
Hạn nộp: 22/06/2026