Từ báo chí đến dữ liệu khoa học
Google đã dùng Gemini để phân tích 5 triệu bài báo trên toàn cầu, trích xuất thông tin về lũ và tạo ra bộ dữ liệu “Groundsource” với 2,6 triệu sự kiện lũ được gắn tọa độ địa lý và thời gian. Đây là lần đầu tiên Google triển khai mô hình ngôn ngữ lớn cho việc chuyển đổi dữ liệu báo chí thành dữ liệu khoa học.
Dựa trên Groundsource, nhóm nghiên cứu huấn luyện một mạng nơ-ron LSTM để kết hợp với dự báo thời tiết toàn cầu, từ đó tính toán xác suất xảy ra lũ quét tại từng khu vực. Hệ thống hiện đã hoạt động trên 150 quốc gia thông qua nền tảng Flood Hub, hỗ trợ các cơ quan ứng cứu khẩn cấp phản ứng nhanh hơn.
Giải pháp cho nơi thiếu hạ tầng khí tượng
Độ phân giải của mô hình chỉ đạt mức 20 km² — chưa đủ chi tiết cho từng khu phố, và vẫn kém hơn hệ thống cảnh báo của Cơ quan Thời tiết Quốc gia Mỹ vốn dựa vào radar theo dõi mưa theo thời gian thực. Tuy nhiên, đó là sự đánh đổi có chủ đích: Flood Hub được thiết kế cho những quốc gia không có ngân sách hoặc hạ tầng khí tượng hiện đại.
Juliet Rothenberg, quản lý chương trình tại nhóm Resilience của Google, cho biết:
“Vì chúng tôi tổng hợp hàng triệu báo cáo, bộ dữ liệu Groundsource giúp cân bằng lại bản đồ thông tin, mở rộng dự báo đến những nơi vốn thiếu dữ liệu.”
Tiềm năng mở rộng
Ngoài lũ quét, cách tiếp cận này có thể mở rộng sang dự báo nắng nóng cực đoan hay sạt lở đất. Marshall Moutenot, CEO của Upstream Tech, nhận định đây là một phần của xu hướng lớn hơn: tạo dữ liệu huấn luyện cho các mô hình AI thời tiết trong bối cảnh vừa thừa vừa thiếu dữ liệu địa chất.
Ông nói:
“Khó khăn lớn nhất trong địa vật lý là sự khan hiếm dữ liệu. Đây là một cách tiếp cận rất sáng tạo để giải quyết vấn đề đó.”
Dù chưa thể thay thế mạng lưới radar hay trạm đo mực nước, nhưng với những khu vực thiếu thốn hạ tầng, việc AI đọc báo chí để dự báo thiên tai có thể là giải pháp khả thi nhất hiện nay.
https://www.technology.org/2026/03/12/google-trained-ai-to-read-millions-of-news-articles-now-it-can-predict-flash-floods/
