Mô tả Công việc
MỤC TIÊU CÔNG VIỆC
Thiết kế, triển khai và tối ưu các pipeline xử lý dữ liệu từ nhiều nguồn (UAV, IoT, GIS, hệ thống vận hành...), đảm bảo dữ liệu được làm sạch, chuẩn hóa và lưu trữ đúng tiêu chuẩn để
phục vụ AI, mô phỏng, phân tích và các ứng dụng khác. Đóng vai trò cầu nối kỹ thuật giữa khâu thu thập dữ liệu và các nhóm sử dụng dữ liệu đầu ra.
MÔ TẢ CÔNG VIỆC
- Thiết kế và triển khai quy trình ETL/ELT cho các nguồn dữ liệu đa dạng;
- Thực hiện làm sạch, chuẩn hóa, hợp nhất dữ liệu, xử lý lỗi và thiếu hụt thông tin;
- Xây dựng và quản lý cơ sở dữ liệu quan hệ (SQL) và phi quan hệ (NoSQL);
- Tối ưu hiệu suất xử lý, giảm thời gian tải và chi phí lưu trữ dữ liệu;
- Phát triển các script hoặc quy trình tự động hóa để cải thiện năng suất xử lý dữ liệu;
- Đảm bảo tính bảo mật, toàn vẹn và khả năng truy xuất dữ liệu;
- Phối hợp với nhóm QA để kiểm tra và đảm bảo dữ liệu đạt tiêu chuẩn chất lượng trước khi bàn giao;
- Hỗ trợ phân tích nguyên nhân sự cố dữ liệu và đưa ra giải pháp khắc phục.