Dữ liệu lớn trong công ty lớn
UPS, công ty vận tải và logistics lớn nhất thế giới, hiện theo dõi 16,3 triệu kiện hàng mỗi ngày cho 8,8 triệu khách hàng. Công ty hiện đang lưu trữ hơn 16 petabyte dữ liệu, hầu hết được thu thập từ các thiết bị cảm biến viễn thông đặt trong hơn 46.000 phương tiện.
Chẳng hạn, dữ liệu trên các xe tải của UPS bao gồm vận tốc, hướng phanh và hiệu suất tài xế nhằm giám sát hoạt động hàng ngày và tái thiết kế cấu trúc tuyến đường lái xe của UPS. Đây là dự án nghiên cứu hoạt động lớn nhất thế giới, nó phụ thuộc nhiều vào dữ liệu bản đồ trực tuyến, với mục tiêu cuối cùng là thiết kế lại việc bốc và dỡ hàng của tài xế trong thời gian thực.
Dự án này đã giúp công ty tiết kiệm được hơn 8,4 triệu gallon nhiên liệu và giảm 85 triệu dặm dường hàng ngày trong năm 2011. UPS ước tính mỗi ngày 1 tài xế tiết kiệm được 1 dặm đường sẽ giúp công ty tiết kiệm được 30 triệu USD. Công ty cũng nỗ lực ứng dụng phân tích Big Data để tăng hiệu quả của 2.000 chuyến bay của hãng mỗi ngày.
United Healthcare, công ty xếp hạng 14 trong danh sách 500 công ty lớn nhất thế giới cũng đã tập trung việc phân tích cấu trúc dữ liệu trong nhiều năm, đặc biệt dữ liệu về thái độ của khách hàng thể hiện qua các ghi âm cuộc gọi của họ đến trung tâm dịch vụ. Mức độ hài lòng của khách hàng ngày càng quan trọng đối với các công ty bảo hiểm y tế, bởi nó liên quan đến sự lựa chọn của người tiêu dùng về các gói bảo hiểm sức khỏe. Trong quá khứ, những dữ liệu thuộc loại này không thể phân tích được. Hiện United đang chuyển dữ liệu giọng nói thành văn bản, sau đó phân tích với phần mềm xử lý ngôn ngữ tự nhiên, qua đó có hướng cải thiện dịch vụ.
Vì có lượng tài sản và cơ sở khách hàng quá lớn (hơn 2.200 tỷ USD và 50 triệu khách hàng vào năm 2012), Ngân hàng Bank of America (BOA) đã phải ứng dụng Big Data từ nhiều năm nhưng chỉ ở mức độ thấp. Hiện nay, BOA tập trung nhiều hơn vào Big Data, đặt trọng tâm vào tiếp cận khách hàng và cơ cấu tổ chức tích hợp, thông qua 3 nhóm Big Data: dữ liệu giao dịch, dữ liệu khách hàng và dữ liệu phi cấu trúc.
Trọng tâm ưu tiên là 2 nhóm đầu. Với lượng dữ liệu khách rất lớn ở nhiều mối quan hệ và nhiều kênh, trước đây BOA không thể cùng lúc phân tích hết và phải phụ thuộc vào các mẫu hệ thống. Nay với công nghệ Big Data, ngân hàng ngày càng tăng khả năng phân tích dữ liệu từ tất cả khách hàng.
Khác với một số thí nghiệm phân tích dữ liệu phi cấu trúc, trọng tâm chính trong nghiên cứu Big Data của BOA là hiểu được khách hàng ở tất cả các kênh tương tác, để đưa ra các chào mời dịch vụ hấp dẫn nhất cho từng phân khúc khách hàng.
Thí dụ, BOA sử dụng mô hình giao dịch và xu hướng để xác định khách hàng có thẻ tín dụng, hay có khoản vay thế chấp có thể được hưởng lợi từ tái cấp vốn tại một đối thủ cạnh tranh. Khi khách hàng đó lên mạng, gọi đến trung tâm khách hàng, hoặc một chi nhánh, thông tin đó sẽ được hiện lên ứng dụng trực tuyến, hoặc giao dịch viên sẽ đưa ra các chào mời.
Các kênh bán hàng khác nhau cũng có liên kết dữ liệu, vì vậy nếu một khách hàng nộp đơn trực tuyến nhưng chưa hoàn thành, sẽ được gửi email chào mời hoặc một email lên lịch hẹn với một chi nhánh ở gần họ. BOA có một chương trình tên "BankAmeriDeals", trả lại tiền mặt cho các chủ thẻ tín dụng hoặc thẻ ghi nợ dựa trên phân tích những nơi họ đã chi trả.
Chỉ trích
Không phủ nhận những lợi ích to lớn Big Data mang lại, nhưng các nhà phê bình vẫn đặt câu hỏi về tác động của phương pháp tiếp cận và khai thác Big Data. Các nhà nghiên cứu về Big Data cho rằng thực tế các công ty chỉ sử dụng được một phần nhỏ dữ liệu Big Data họ thu thập được.
Thí dụ, ngay cả khi các công ty đã đầu tư hàng tỷ USD vào Big Data và lấy được thông tin về nhiều thứ, nhưng chỉ chưa tới 40% nhân viên có thể hiểu và tận dụng các thông tin này. Điều đó làm giảm hiệu quả của Big Data rất nhiều, dẫn đến lãng phí tài nguyên. Ngoài ra, còn có chỉ trích rằng Big Data chỉ có thể miêu tả thế giới trong quá khứ, hoặc nếu tốt lắm miêu tả được trong hiện thực.
Việc kết hợp những kinh nghiệm thực tế trong quá khứ và hiện tại có thể giúp đưa ra những dự báo chính xác về tương lai. Tuy nhiên, nếu các yếu tố hệ thống trong tương lai thay đổi, quá khứ hầu như không nói gì được về tương lai. Việc sử dụng Big Data để nói về tương lai cần phải kết hợp thêm với các phương pháp mô hình, mô phỏng hay nghiên cứu về sự chuyển động của thế giới. Bên cạnh đó, người ta còn lo lắng về vấn đề quyền riêng tư của người dùng.
Đây được xem là trở ngại lớn nhất cho phát triển Big Data. Việc thu thập Big Data có thể đi kèm thông tin có khả năng định dạng người dùng mà không được sự đồng ý của họ, và điều đó vi phạm luật ở một số quốc gia. Nhiều chuyên gia từ nhiều lĩnh vực khác nhau hiện đang thúc đẩy việc bảo vệ quyền riêng tư khi sử dụng Big Data.
Nhà nghiên cứu Danah Boyd đã đưa ra quan ngại của mình rằng việc sử dụng Big Data trong chọn mẫu thống kê có thể gây ra sự chủ quan và ảnh hưởng đến kết quả cuối cùng. Việc khai thác dữ liệu từ một số nguồn là Big Data, trong khi những nguồn khác không phải là dữ liệu lớn sẽ đặt ra những thách thức khi phân tích dữ liệu.
Erik Swan, đồng sáng lập kiêm Giám đốc công nghệ Công ty Spunk, dự đoán sự thay đổi nhất trong Big Data chính là thái độ của mọi người đối với nó. Mọi người sẽ mặc định sử dụng dữ liệu để phân tích mọi thứ trong vòng 10 năm tới. Tất nhiên, để Big Data được sử dụng rộng rãi, kỹ thuật và công nghệ phải phát triển theo. Còn theo Ankur Jain, nhà sáng lập và CEO của Humin, bối cảnh phát sinh ra dữ liệu sẽ trở nên quan trọng hơn: "Chúng ta sẽ bắt đầu định tuyến dữ liệu vào các đối tượng, sự vật, sự việc trong đời thực và chuyện đó giúp chúng ta xử lý công việc tốt hơn".
Trong khi đó, Daniel Kaufman, Giám đốc đổi mới về thông tin của cơ quan nghiên cứu thuộc Bộ Quốc phòng Hoa Kỳ, cho rằng dữ liệu sinh học sẽ ngày càng được quan tâm hơn và người ta sẽ dùng dữ liệu này để đưa ra những lời khuyên có ảnh hưởng lớn đến lối sống và cuộc đời của con người. Thí dụ, bạn có nên thêm một dĩa cơm tấm sườn nữa không, hay là nên ăn thêm một dĩa cơm gà?
Ông Swan còn tin rằng các công ty chuyên cung cấp giải pháp Big Data sẽ không còn bán dữ liệu và phân tích cho từng doanh nghiệp hay công ty riêng lẻ để phục vụ cho những mục đích quá chuyên biệt. Thay vào đó, họ sẽ mở rộng nó và áp dụng Big Data nhằm giải quyết những vấn đề trong đời thường và trả lời cho các nhu cầu cơ bản của con người. Đó sẽ là sự thay đổi về tính ứng dụng của Big Data.
Theo báo Sài Gòn Đầu Tư