Dưa chuột là giống cây dễ trồng vốn đầu tư ít kĩ thuật chăm sóc đơn giản. Cây phù hợp với điều kiện thổ nhưỡng ở nhiều địa phương, ít sâu bệnh, có giá trị dinh dưỡng và hiệu quả kinh tế cao hơn so với loại cây trồng khác. Khoảng 30 – 50 ngày sau khi trồng thì dưa chuột bắt đầu ra hoa kết trái, các nách lá bắt đầu đâm hoa đực, hoa cái và nhánh. Hoa cái mọc ở nách lá thành đôi hay riêng biệt với đặc trưng có quả ở cuống hoa (Hình 1.a). Hoa đực mọc thành từng cụm từ năm đến bảy hoa và đặc trưng khác ở hoa cái là chỉ có hoa không có quả ở cuống hoa (Hình 1.b). Dựa vào đặc điểm khác nhau trên có thể nhận diện và phân loại hoa đực và hoa cái. Đây là một yếu tố quan trọng để dự đoán năng suất mùa vụ dưa chuột.
Hình 1. Hoa dưa chuột
Nghiên cứu này xây dựng một mô hình nhận diện hoa đực và hoa cái dựa trên mô hình học sâu Support Vector Machine (SVM). Thời gian thực hiện từ 1/2021-7/2021 tại Học viện Nông nghiệp Việt Nam. Mô hình được huấn luyện từ bộ dữ liệu gồm 880 mẫu hoa dưa chuột đực và cái được thu thập bằng máy ảnh Sony DSC-W830s, camera trên điện thoại Redmi Note 7 và camera trên điện thoại Iphone 8 Plus. Hình 2 và Hình 3 tương ứng là thuật toán của quá trình tiền xử lý và kết quả của quá trình. Ảnh gốc thu thập được là ảnh mầu RGB có kích thước lớn, đa biến gây khó khăn cho quá trình xử lý dữ liệu, vì vậy ảnh gốc được chuyển đổi sang ảnh xám và giảm kích thước về 50×50 pixel. Ảnh xám có kích thước 50×50 pixel được chuyển đổi sang ma trận một chiều. Bộ dữ liệu đầu vào để huấn luyện mô hình là 880 ma trận một chiều thu được sau quá trình tiền xử lý.
Hình 2. Quá trình tiền xử lý
Hình 3. Kết quả của quá trình tiền xử lý
Quá trình huấn luyện mô hình nhận dạng hoa dưa chuột đực và cái được thực hiện trên thư viện mã nguồn mở LibSVM. Từ bộ dữ liệu 880 mẫu chọn ngẫu nhiên 800 mẫu trong đó có 400 mẫu hoa đực và 400 mẫu hoa cái để huấn luyện mô hình, 80 mẫu còn lại được dùng để thử nghiệm mô hình.
Nghiên cứu bước đầu cho kết quả tốt, kết quả thử nghiệm trên 80 mẫu cho thấy tỷ lệ dự đoán chính xác của mô hình trên 90%. Tuy nhiên vẫn còn một số mẫu đầu vào mô hình chưa nhận diện đúng. Để nâng cao độ chính xác của mô hình cần có bộ mẫu đa dạng và đầy đủ hơn. Trong thời gian tới, nhóm nghiên cứu tiếp tục thu thập mẫu để hoàn thiện mô hình.
ThS. Nguyễn Kim Dung; SV: Chu Văn Thuận