1. Thiết Lập Hệ Thống (Setup & Deployment)
- Triển khai Hệ điều hành: Cài đặt, cấu hình và tối ưu hóa các HĐH server (Windows Server, Linux các bản phân phối như Ubuntu, CentOS, RedHat).
- Cấu hình Dịch vụ Mạng: Thiết lập và quản lý các dịch vụ như DNS, DHCP, Firewall, Proxy, VPN để đảm bảo kết nối mạng ổn định và an toàn.
- Triển khai Hạ tầng Ảo hóa & Đám mây:
+ Ảo hóa: Sử dụng VMware vSphere, Hyper-V, Proxmox để tạo và quản lý các máy ảo.
+ Cloud: Triển khai hạ tầng trên các nền tảng đám mây như AWS, Azure, Google Cloud Platform (GCP). Công việc bao gồm tạo VPC (mạng ảo), EC2/Virtual Machines (máy chủ ảo), Load Balancer,...
- Triển khai Ứng dụng: Cài đặt và cấu hình các phần mềm, ứng dụng cần thiết lên server (ví dụ: Web Server - Nginx/Apache, Cơ sở dữ liệu - MySQL/PostgreSQL, Ứng dụng Java/Python/.NET).
- Tự động hóa Triển khai: Sử dụng các công cụ như Ansible, Puppet, Chef để tự động hóa việc cài đặt và cấu hình hàng loạt server, đảm bảo tính đồng nhất và tiết kiệm thời gian.
2. Giám sát & Bảo Trì Định Kỳ (Monitoring & Maintenance)
-
Giám sát Hệ thống:
+ Thiết lập các công cụ giám sát (như Zabbix, Nagios, Prometheus + Grafana, Datadog) để theo dõi theo thời gian thực:
- Tài nguyên phần cứng: CPU, RAM, Disk I/O, Network Traffic.
- Tình trạng dịch vụ: Web server, database có đang chạy không?
- Hiệu năng ứng dụng: Thời gian phản hồi (response time), tỷ lệ lỗi.
+ Thiết lập cảnh báo (alert) qua email, SMS, Slack khi có sự cố xảy ra.
- Quản lý Sao lưu và Phục hồi (Backup & Recovery):
+ Lập lịch sao lưu tự động: Định kỳ sao lưu dữ liệu, cấu hình hệ thống và ứng dụng.
+ Kiểm tra tính toàn vẹn của bản sao lưu: Định kỳ thử phục hồi từ bản sao lưu để đảm bảo nó hoạt động khi cần.
+ Có kế hoạch dự phòng (Disaster Recovery Plan): Xác định RTO (Thời gian phục hồi mục tiêu) và RPO (Điểm phục hồi mục tiêu).
- Quản lý Người dùng và Quyền:
+ Tạo, xóa, phân quyền truy cập cho người dùng và nhóm người dùng.
+ Áp dụng nguyên tắc đặc quyền tối thiểu (principle of least privilege).
- Cập nhật & Quản lý Bản vá:
+ Định kỳ cập nhật các bản vá bảo mật và bản cập nhật phần mềm cho HĐH và ứng dụng.
+ Cần có quy trình thử nghiệm trước khi áp dụng lên môi trường production để tránh gây gián đoạn.
3. Xử Lý Sự Cố & Tối Ưu Hóa (Troubleshooting & Optimization)
- Xử lý sự cố: Khi hệ thống gặp vấn đề (chậm, treo, mất kết nối), kỹ sư cần:
+ Phân tích log hệ thống, log ứng dụng.
+ Sử dụng các lệnh để chẩn đoán (trên Linux: top, htop, iostat, netstat, ssh, grep...).
+ Phối hợp với các team phát triển để tìm ra nguyên nhân gốc rễ (root cause).
- Tối ưu hóa Hiệu năng:
+ Điều chỉnh cấu hình hệ điều hành, cơ sở dữ liệu và ứng dụng để khai thác tối đa hiệu suất.
+ Phân tích nút thắt cổ chai (bottleneck) và đề xuất nâng cấp phần cứng/nền tảng nếu cần.
- Dọn dẹp & Quản lý Dung lượng:
+ Theo dõi dung lượng ổ đĩa, xóa các file log, cache không cần thiết.
+ Quản lý vòng đời của dữ liệu.
________________________________________
Các Công Cụ & Công Nghệ Chính Cần Biết
- Hệ điều hành: Linux (là bắt buộc), Windows Server.
- Scripting: Bash shell, Python, PowerShell (cho Windows) để tự động hóa các tác vụ lặp đi lặp lại.
- Cơ sở dữ liệu: Kiến thức cơ bản về quản lý và sao lưu MySQL, PostgreSQL, MongoDB.
- Mạng máy tính: Hiểu sâu về TCP/IP, DNS, DHCP, Firewall, VLAN, VPN.
- Ảo hóa & Cloud: VMware, Hyper-V, và ít nhất một nền tảng Cloud (AWS, Azure, GCP).
- Công cụ Giám sát: Zabbix, Nagios, Prometheus, Grafana.
- Công cụ Tự động hóa & Cấu hình: Ansible, Terraform (cho việc "xây dựng hạ tầng bằng code - Infrastructure as Code").
- Container & Orchestration (Quan trọng với DevOps): Docker, Kubernetes.
- Tư duy Phân tích & Giải quyết Vấn đề: Khả năng suy luận logic để tìm ra gốc rễ của sự cố phức tạp.
- Chịu được Áp lực: Khi hệ thống production gặp sự cố, bạn là người được gọi đầu tiên và cần phản ứng nhanh, bình tĩnh.
- Tỉ mỉ & Có Hệ thống: Một thay đổi nhỏ trong cấu hình có thể gây ra hậu quả lớn. Luôn ghi chép và lập tài liệu đầy đủ.
- Ham học hỏi: Công nghệ thay đổi chóng mặt, bạn luôn cần cập nhật các công cụ và xu hướng mới (đặc biệt là Cloud và Container).
* QUYỀN LỢI:
- Mức lương cạnh tranh theo năng lực + phụ cấp công tác. Thỏa thuận trực tiếp theo năng lực
- Chế độ phúc lợi đầy đủ và hỗ trợ bảo hiểm cho nhân viên.
- Cơ hội thăng tiến và phát triển nghề nghiệp cao.
- Môi trường làm việc năng động, sáng tạo và thân thiện.
- Cơ hội làm việc trong các dự án.