Phân tích dữ liệu và học máy đang đạt được nhiều tiến bộ. Nhưng đó chỉ đơn giản là bước tiếp theo có thể có trong quá trình phát triển đang diễn ra của quá trình sản xuất, lưu trữ, chia sẻ và học tập qua mạng.
Sự phát triển của dữ liệu…
- Sự khan hiếm dữ liệu - Vào đầu những năm 1990 trở về trước, dữ liệu khá khan hiếm, cả do sản xuất dữ liệu còn thấp (so với ngày nay) và do cơ chế lưu trữ và chia sẻ dữ liệu bị hạn chế hơn.
- Sản xuất dữ liệu - những năm 2000 đã trở thành kỷ nguyên của cảm biến. Với những tiến bộ trong lĩnh vực điện tử, các cảm biến trở nên hợp lý hơn. Do đó, việc sản xuất các cảm biến và sự đa dạng của các loại cảm biến mới đã tăng lên đáng kể. Với quy mô rộng lớn của các cảm biến được triển khai, quá trình sản xuất dữ liệu đã phát triển - và tiếp tục phát triển - theo cấp số nhân.
- Lưu trữ Dữ liệu - với sự gia tăng của sản xuất dữ liệu, nhu cầu lưu trữ dữ liệu hiệu quả về chi phí ngày càng tăng. Ở quy mô lớn, việc lưu trữ dữ liệu giờ đây đã trở nên quá rẻ, nó đạt đến mức chi phí không đáng kể cho đến khi kích thước dữ liệu lớn hơn.
- Chia sẻ dữ liệu - vào những năm 1990, các công ty đã tạo ra dữ liệu nội bộ của riêng họ, nhưng phần lớn dữ liệu này không được chia sẻ ra bên ngoài công ty. Cũng không phải là kiến thức chung, ngoại trừ ở dạng in. Với sự ra đời của Internet và việc áp dụng rộng rãi sau đó (1993+), việc chia sẻ dữ liệu trở nên phổ biến hơn bao giờ hết (đặc biệt là với sự gia tăng của các API), nhưng phần lớn nó vẫn không có cấu trúc.
- Dữ liệu cấu trúc - các chuyên gia trong ngành hiểu biết về công nghệ đã nhìn thấy các mẫu có thể lặp lại trong các bộ thông tin có sẵn và bắt đầu cấu trúc nó, mỗi lần một ngành dọc. Thu thập và đối chiếu là lần tiếp theo “có thể có”, (khoảng năm 2004 - 2016). Trên thực tế, đây là cách PrivateEquityInfo.com bắt đầu vào năm 2004. Tôi đã xác định được cơ hội để cấu trúc dữ liệu trên vốn cổ phần tư nhân và các công ty &sự kiện M&A liên quan. Điều này giúp mọi người tiết kiệm rất nhiều thời gian tìm hiểu thông tin và kết nối mạng lưới chuyên nghiệp, đồng thời tăng hiệu quả thực hiện các thương vụ mua bán và sáp nhập.
- Phân tích dữ liệu - với dữ liệu có cấu trúc, giờ đây, thông qua các thuật toán, chúng tôi có khả năng phân tích và phát hiện các xu hướng trên dữ liệu theo thời gian hơn bao giờ hết. Điều này đã giúp chúng tôi hiểu rõ hơn về bối cảnh lịch sử, cho phép dự đoán tương lai từ các xu hướng lịch sử, (2008+). Nó cũng cung cấp thông tin chi tiết hữu ích, ít nhất là mang tính định hướng.
- Dữ liệu lớn - khi dữ liệu ngày càng trở nên hữu ích hơn trong việc ra quyết định, chúng tôi bắt đầu thu thập ngày càng nhiều dữ liệu. Với dữ liệu (và đủ sức mạnh xử lý) thì càng tốt (giả sử chất lượng dữ liệu không bị suy giảm khi mở rộng dữ liệu… thường là giả định bị lỗi).
- Dữ liệu thông minh &Máy học - khi việc thu thập dữ liệu có cấu trúc từ các cảm biến và các đầu vào khác nhau bắt đầu vượt xa đáng kể khả năng (con người) của chúng tôi để theo kịp nó, chúng tôi bắt đầu sử dụng các kỹ thuật máy học để thiết lập các mối quan hệ trong dữ liệu và tạo ra các dự đoán và chỉ báo tốt hơn về tương lai. Máy học, được cung cấp với khối lượng lớn dữ liệu mạnh hơn nhiều so với các thuật toán do con người mã hóa. Từ một lượng lớn dữ liệu, máy móc có thể tạo ra những kiểu mẫu mà con người không thể làm được. Họ có thể học nhanh hơn, xác định mối tương quan nhân quả trong dữ liệu và do đó dự đoán kết quả với độ chính xác tốt hơn con người. Các thuật toán thông minh, học bằng máy học, theo hướng dữ liệu, cùng với vô số dữ liệu hiện có trí thông minh gần đúng - trí tuệ nhân tạo (2015+).
Tiếp theo là gì?
Học tập qua mạng - trong năm 2018+, máy móc tạo ra dữ liệu, cung cấp dữ liệu ở định dạng có cấu trúc, được xác định trước, chia sẻ dữ liệu này với các máy khác và để mạng lưới các máy học hỏi lẫn nhau. Máy siêu thông minh. Nó mô hình hóa gần hơn mạng lưới phức tạp của não người, ngoại trừ khả năng xử lý mạnh hơn, khả năng lưu trữ nhiều hơn và truy xuất thông tin nhanh hơn. Đây không phải là điểm kỳ lạ, nhưng nó sẽ là một bước tiến vượt bậc - đến mức trí thông minh do máy móc tạo ra sẽ không cảm thấy quá giả tạo.