Vị trí công việc này hiện tại đã hết hạn nộp hồ sơ, bạn có thể tham khảo thêm một số công việc liên quan phía dưới
Job Description
POSITION INTRODUCTION
We are looking for a professional Data Scraping specialist, capable of operating a large-scale data collection system, ensuring stability, accuracy and efficiency.
1. Professional Scraping System Development
Technical Requirements:
System Architecture:
Design cross-platform Python crawling scripts
Build scalable systems
Develop parallel crawling solutions
Manage large, multi-threaded data streams
Technologies:
Scrapy, BeautifulSoup
Selenium
Asyncio, Multiprocessing
Proxy management
IP rotation techniques
2. Data Processing and Normalization
Processing Methods:
Develop API data cleaning processes
Data transformation algorithms
Integrity checks
Remove noisy data
Tools:
Pandas
Data validation techniques
Machine Learning preprocessing
3. Database Management
Specialized Skills:
Advanced SQL:
Complex queries
Performance optimization
4. Monitoring & Optimization
Strategy:
Manage scraping system operations.
Track scraping performance
Challenge handling:
IP blocking
Speed limiting
CAPTCHA
PROFESSIONAL REQUIREMENTS
Education
Bachelor's degree (GPA > 3.0)
Major:
Data science
Computer engineering
Data related fields
English: TOEIC > 700 of IELTS >5.5
Technical Skills
Python Ecosystem
Asyncio, Multiprocessing
Data cleaning techniques
Machine Learning preprocessing
Advanced error handling
Database & Big Data
SQL (Intermediate to Advanced)
NoSQL database management
PySpark
Data warehousing
In-depth Experience
Minimum 1-2 years
Project implementation:
Web scraping
Automatic data processing
Big data crawling
SOFT SKILLS
System analysis
Problem solving
Independent & team working
Time management
Logical thinking
NICE TO HAVE EXPERIENCES
Big Data experience
Data pipeline design
Working with diverse APIs
Professional certifications
Creativity and initiative in proposing ideas
BENEFITS
Modern technology environment
Competitive salary
Development opportunities
Continuous training
EVALUATION CRITERIA
System stability
Data quality
Processing efficiency
Scalability
REPORTING
Directly report to: Manager and Board of Directors
Reporting content: according to reporting regulations and reporting content for the technical
Types of Reports:
Daily Progress Report
Weekly Report
Monthly Report
Milestone Quick Report
Incident Report
Performance Report
OTHER RELATED FACTORS
Working hours: 07 hours/day (Morning from [protected info], Afternoon from 13:00 - 16:30), from Monday to Friday, off on Saturday & Sunday.
Working equipment: provided
Salary: 12 - 18 million/month
Thông tin chung
- Ngày hết hạn: 21/03/2025
- Thu nhập: Thỏa thuận
Bắt đầu vào năm 2018, nhóm của chúng tôi chỉ có ba thành viên cùng nhau phát triển dịch vụ SEO doanh nghiệp này. Nhìn lại, chúng tôi không làm gì ngoài việc đầu tư đam mê và trau dồi kiến thức nhiều nhất có thể. Sau một vài dự án thành công là kết quả của những ngày tháng dài gian khổ, chúng tôi ...
Quy mô công ty
Từ 26 - 100 nhân viên
Các thông tin được cung cấp chỉ nhằm mục đích cho người dùng tham khảo, JobOKO không đại diện và không có sự liên quan tới doanh nghiệp công ty cổ phần webify group trong các hoạt động tuyển dụng. Các thông tin bản quyền, nhãn hiệu hoặc bất kỳ quyền sở hữu trí tuệ nào liên quan đến nội dung, thương hiệu hay hình ảnh doanh nghiệp này không thuộc sở hữu của JobOKO.
Người dùng cần tự xác minh thông tin trước khi ứng tuyển, giao dịch hoặc đưa ra bất kỳ quyết định nào dựa trên các nội dung này.