Đầu tư AI:Đặt nền móng (Phần I)

Tóm tắt Điều hành

AI là gì?
  • Trí tuệ nhân tạo (AI), có thể được giải thích đơn giản là trí thông minh do máy móc thể hiện, trái ngược với trí thông minh tự nhiên của con người và các loài động vật khác.
  • Học máy là một tập hợp con các kỹ thuật được sử dụng trong AI và học sâu là một tập hợp con các kỹ thuật được sử dụng trong học máy.
  • Đã có ba làn sóng phát triển AI quan trọng. Lần đầu tiên vào những năm 50 và 60, lần thứ hai vào những năm 80 và 90, và lần thứ ba bắt đầu cách đây một thập kỷ và đã trở nên nổi tiếng kể từ năm 2016 (AlphaGo).
Điều gì đặc biệt về làn sóng AI này?
  • Làn sóng AI này được thúc đẩy bởi sự phát triển và phổ biến của học sâu.
  • Mặc dù các kỹ thuật học sâu đã xuất hiện từ những năm 60, nhưng sức mạnh tính toán và dữ liệu cần thiết vẫn chưa đủ nâng cao để hỗ trợ ứng dụng thương mại hàng loạt cho đến vài năm gần đây.
  • Lý do tại sao học sâu lại thú vị là nói một cách đơn giản, học sâu mang lại hiệu suất mạnh mẽ hơn nhiều so với các thuật toán học tập khác.
Các thành phần chính của các ứng dụng AI thành công.
  • Các ứng dụng AI cần giải quyết một vấn đề được xác định rõ ràng (cụ thể) và mong muốn (nhắm mục tiêu các điểm khó khăn khẩn cấp và rõ ràng của khách hàng). Nhận dạng khuôn mặt, dịch máy, ô tô không người lái, tối ưu hóa công cụ tìm kiếm, tất cả đều là những vấn đề mong muốn được xác định rõ. Tuy nhiên, việc thiếu các vấn đề mong muốn được xác định rõ ràng là lý do tại sao rất khó sản xuất, chẳng hạn như rô bốt dọn dẹp nhà cửa nói chung.
  • Các thuật toán học máy yêu cầu quyền truy cập vào dữ liệu sạch sẽ và được gắn nhãn tốt. Bài tập thu thập dữ liệu này có thể khó hoặc dễ, tùy thuộc vào ứng dụng thương mại mà bạn đang phát triển.
  • Một doanh nghiệp AI cần phát triển các thuật toán mạnh mẽ và có thể mở rộng. Để đạt được điều này, cần có ba yếu tố:một lượng lớn dữ liệu được gắn nhãn tốt, tài năng phù hợp và sự tự tin rằng học sâu là công nghệ chính xác để giải quyết vấn đề.
  • Các ứng dụng AI thành công đòi hỏi nhiều khả năng tính toán. Thuật toán trí tuệ nhân tạo càng nâng cao (ví dụ:mạng nơ-ron học sâu), thì sức mạnh tính toán càng cao, hoạt động càng tốn kém.

Trong vài năm gần đây, thế giới đã chứng kiến ​​sự bùng nổ của mối quan tâm xoay quanh Trí tuệ nhân tạo (AI). Một khái niệm từng được giới hạn chủ yếu trong thể loại Khoa học viễn tưởng, AI đã trở thành một phần trong cuộc sống hàng ngày của chúng ta. Chúng tôi thường xuyên đọc tin tức về vấn đề này, xem video về những con rô bốt trông đáng sợ nhảy theo giai điệu của Uptown Funk và nghe về cách các ứng dụng AI đang thâm nhập vào những lĩnh vực bất ngờ nhất trong cuộc sống hàng ngày của chúng ta. Nhưng nó có phải là sự cường điệu không?

Nó có thể là. Theo Chu kỳ cường điệu cho các công nghệ mới nổi của Gartner, các xu hướng AI dân chủ hóa bao gồm AI PaaS (nền tảng như một dịch vụ), Trí tuệ chung nhân tạo, Lái xe tự động, Học sâu, tất cả đều ở các điểm khác nhau trên đường cong, với Deep Neural Nets đang ở đỉnh kỳ vọng tăng cao. Tuy nhiên, chúng ta cũng đang được hưởng lợi từ AI mỗi ngày. Từ Siri đến Cortana đến Alexa, giờ đây chúng ta có thể trò chuyện với các trợ lý thông minh. Từ công cụ tìm kiếm được hỗ trợ bởi AI của Google đến các bộ lọc của Instagram, giờ đây chúng tôi tận hưởng sự tiện lợi của những phản hồi nhanh chóng, phù hợp hơn với nhu cầu của chúng tôi. Ở Trung Quốc, nơi mà sự đổi mới của AI đang phát triển mạnh, các công ty như công nghệ nhận dạng khuôn mặt Face ++ đang cung cấp khả năng xác thực ID tức thì cho các ngân hàng, trong khi các ứng dụng như TikTok quảng bá video ngắn cho hàng triệu thanh thiếu niên (trên thực tế đang gây tranh cãi đáng kể khi làm như vậy).

Cá nhân tôi tin rằng mặc dù chắc chắn có một số kỳ vọng và doanh nghiệp bị thổi phồng quá mức nhưng AI là tương lai . Tôi đã thành lập công ty khởi nghiệp AI giai đoạn đầu của riêng mình để nắm bắt cơ hội chỉ có một lần trong đời này để tham gia vào cuộc cách mạng công nghệ. Là một cựu nhà đầu tư VC, tôi cũng không ngừng tìm kiếm các cơ hội đầu tư vào AI. Do đó, tôi tin rằng, bất chấp tiếng ồn không thể phủ nhận xung quanh không gian, sự gia tăng mạnh mẽ trong đầu tư vào AI cũng được đảm bảo.

Nhưng với điều này, tôi ngạc nhiên rằng, đặc biệt là trong cộng đồng đầu tư, vẫn còn một khoảng cách lớn trong sự hiểu biết. Các nhà đầu tư rất muốn bỏ tiền để làm việc, nhưng họ thường thiếu kiến ​​thức cơ bản quan trọng mà theo tôi, cần phải có để trở thành một nhà đầu tư hiệu quả trong lĩnh vực này. Do đó, mục đích của bài viết này là chia sẻ và cung cấp một số bối cảnh và thông tin hữu ích cho những ai quan tâm đến việc đầu tư vào lĩnh vực thú vị này. Với tầm rộng của chủ đề, tôi đã chia suy nghĩ của mình thành hai phần, phần đầu tiên nhằm mục đích thảo luận về một số yếu tố thiết yếu mà người ta cần biết để bắt đầu hành trình AI - gồm 101 loại. Phần thứ hai của loạt bài này sẽ thực tế hơn và sẽ đi sâu hơn vào chủ đề về cách đánh giá các khoản đầu tư vào AI và các cách đầu tư khác nhau.

N.B. Bài đăng này không có nghĩa là kỹ thuật. Nó hướng đến các nhà đầu tư và cộng đồng tài chính rộng lớn hơn, và do đó là những độc giả không chuyên về kỹ thuật.

AI là gì?

Thực tế có rất nhiều định nghĩa về AI, vì vậy khi tôi được yêu cầu định nghĩa nó, tôi thường mặc định là Wikipedia cổ điển, đối với những người không am hiểu kỹ thuật, tôi nghĩ rằng nó cung cấp một định nghĩa thỏa đáng:

Trí tuệ nhân tạo (AI), đôi khi được gọi là trí thông minh máy móc, là trí thông minh do máy móc thể hiện, trái ngược với trí thông minh tự nhiên được hiển thị bởi con người và các loài động vật khác.

Nói cách khác, mọi trí thông minh không phải tự nhiên đều là trí tuệ “nhân tạo”, bất kể nó đạt được như thế nào. Các kỹ thuật được sử dụng để đạt được AI bao gồm quy tắc if-then, logic, cây quyết định, hồi quy và học máy bao gồm cả học sâu. Một trong những công cụ yêu thích và thú vị của tôi để giải thích cách hoạt động của AI là video này về cách máy tính học cách chơi Super Mario.

Khi nói về AI, bạn sẽ luôn nghe thấy ba thuật ngữ chính sau:AI, máy học và học sâu. Chúng đôi khi được sử dụng thay thế cho nhau, nhưng chúng khác nhau. Nói một cách đơn giản, học máy là một tập hợp con các kỹ thuật được sử dụng trong AI. Học sâu là một tập hợp con các kỹ thuật được sử dụng trong học máy .

Blog Nvidia thực hiện một công việc tốt khi tóm tắt mối quan hệ giữa ba thuật ngữ. Nó cũng cung cấp một cái nhìn tổng quan hữu ích về ba làn sóng phát triển của AI. Làn sóng đầu tiên của AI là vào những năm 50 và 60 và chứng kiến ​​một số cột mốc quan trọng đầu tiên, chẳng hạn như khi IBM 701 giành chiến thắng trong trò chơi cờ caro trước bậc thầy rô bốt Robert Nealey. Trong những năm 80 và 90, Deep Blue đã đánh bại bậc thầy con người Kasparov ở môn Cờ vua. Vào tháng 3 năm 2016, AlphaGo đã đánh bại Kỳ thủ cờ vây số 1 Lee Sedol. Mỗi khi AI đánh bại những bậc thầy của con người trong các trò chơi, nó lại tạo ra một giai đoạn cường điệu mới cho AI. Sau đó, khi công nghệ không thể cung cấp các ứng dụng đáp ứng kỳ vọng của công chúng, sự cường điệu của AI sẽ biến thành mùa đông AI, với các khoản đầu tư và tài trợ nghiên cứu bị thu hẹp.

Như đã đề cập trước đây, học máy là một tập hợp con của AI. Theo Nvidia, machine learning về cơ bản là “thực hành sử dụng các thuật toán để phân tích dữ liệu, học hỏi từ nó, và sau đó đưa ra quyết định hoặc dự đoán về điều gì đó trên thế giới. Vì vậy, thay vì viết tay các quy trình phần mềm với một bộ hướng dẫn cụ thể để hoàn thành một tác vụ cụ thể, máy được ‘huấn luyện’ bằng cách sử dụng một lượng lớn dữ liệu và thuật toán để cho nó khả năng học cách thực hiện nhiệm vụ ”. Một ví dụ rất phổ biến về học máy là bộ lọc thư rác. Bộ lọc spam của Google có thể nhận dạng spam bằng cách xác định các từ kích hoạt như “Prince”, “Nigeria” và “luxury watch”. Nó cũng có thể tiếp tục “học” từ cách phân loại spam thủ công của người dùng. Ví dụ:một email có thông báo “gửi $ 1000 để nhận loại thuốc điều trị ung thư độc quyền này vào tài khoản ngân hàng sau” đã bị bộ lọc spam của Google bỏ sót. Sau khi người dùng gắn nhãn nó là spam, Gmail sẽ phân tích tất cả các từ khóa trong email cụ thể đó và “học” cách xử lý các email chứa các từ kết hợp “$ 1000”, “ma túy” và “tài khoản ngân hàng” là spam về sau. Có rất nhiều mô hình toán học được các chuyên gia sử dụng để thực hiện học máy, ví dụ:hồi quy, hậu cần, mạng Bayes, phân cụm.

Điều gì đặc biệt về làn sóng AI này?

Làn sóng AI này được thúc đẩy bởi sự phổ biến của học sâu . Là một tập hợp con của học máy, học sâu không được phát minh gần đây. Trên thực tế, theo Wikipedia, “thuật toán học tập tổng quát đầu tiên cho các perceptron được giám sát, sâu, chuyển tiếp, nhiều lớp được Alexey Ivakhnenko và Lapa xuất bản vào năm 1965”. Tuy nhiên, vì sức mạnh tính toán và dữ liệu không đủ nâng cao để hỗ trợ ứng dụng thương mại hàng loạt của các kỹ thuật học sâu, nó đã không trở nên phổ biến cho đến năm 2006 khi Geoffrey Hinton và cộng sự xuất bản bài báo đầu tiên của họ, “Một thuật toán học nhanh cho niềm tin sâu sắc Nets. ” Bất chấp mùa đông AI của những năm 90 và nửa đầu năm 2000, một số học giả, bao gồm ba chuyên gia học thuật về học sâu, Geoffrey Hinton, Yann LeCun và Yoshua Bengio, vẫn tiếp tục làm việc về học sâu trong lĩnh vực học thuật. Sự đột phá nhanh chóng của sức mạnh tính toán, chẳng hạn như điện toán đám mây và GPU, cùng với sự sẵn có của dữ liệu lớn thông qua nền kinh tế kỹ thuật số, đã khiến các thuật toán học sâu có thể được triển khai trong thập kỷ qua. Ví dụ:nghiên cứu về ô tô tự lái của Google bắt đầu vào năm 2009.

Nói về mặt kỹ thuật, học sâu có thể được định nghĩa là “một loại thuật toán học máy:

  • sử dụng một chuỗi nhiều lớp đơn vị xử lý phi tuyến để trích xuất và chuyển đổi đối tượng địa lý. Mỗi lớp kế tiếp sử dụng đầu ra từ lớp trước làm đầu vào.
  • học cách cư xử có giám sát (ví dụ:phân loại) và / hoặc không giám sát (ví dụ:phân tích mẫu).
  • học nhiều cấp độ biểu diễn tương ứng với các cấp độ trừu tượng khác nhau; các cấp độ tạo thành một hệ thống phân cấp các khái niệm. ”

Chìa khóa là "nhiều lớp", so với học máy truyền thống. Ví dụ, bạn sẽ phân biệt một con mèo với một con chó như thế nào? Nếu bạn đang sử dụng máy học, bạn có thể trích xuất một số đặc điểm chung cho cả chó và mèo, chẳng hạn như hai tai, khuôn mặt có lông, khoảng cách giữa mắt và mũi và miệng, v.v. Và bạn có thể nhận được kết quả cho biết hình ảnh là 50% con chó, 50% con mèo - không hữu ích cho lắm. Tuy nhiên, khi sử dụng học sâu, bạn thậm chí không biết các đặc điểm phân biệt của mèo và chó là gì, nhưng cỗ máy, thông qua nhiều lớp tạo ra các tính năng mới và hàng trăm (hoặc hàng nghìn) mô hình thống kê, sẽ cung cấp thêm đầu ra chính xác - ví dụ:90% chó, 10% mèo. Hai biểu đồ bên dưới minh họa cách mạng thần kinh “học” và sự khác biệt giữa học máy cổ điển và mạng thần kinh.

Người đọc có thể sẽ vò đầu bứt tai sau khi đọc những điều trên, và đúng như vậy. Nhưng quay trở lại mục đích ban đầu của chúng tôi:từ quan điểm của một nhà đầu tư, học sâu có gì đặc biệt? Người ta có thể trả lời câu hỏi này bằng nhiều giải thích kỹ thuật phức tạp hơn, nhưng thực sự đơn giản mà nói, biểu đồ bên dưới bên trái thực hiện rất tốt việc làm cho nó thực sự rõ ràng:học sâu cho phép hiệu suất mạnh mẽ hơn nhiều so với các thuật toán học tập khác. Lấy ví dụ về nhận dạng giọng nói được blog của Microsoft nêu chi tiết (biểu đồ bên dưới bên phải):tỷ lệ lỗi nhận dạng giọng nói ban đầu năm 1988 là 60-70%, trong khi hệ thống mới của Microsoft sử dụng học sâu chỉ là 6,3% vào năm 2014.

Các thành phần chính của các ứng dụng AI thành công

Tôi tin rằng có 4 thành phần chính dẫn đến thành công của sản phẩm học máy (bao gồm cả học sâu):các vấn đề mong muốn được xác định rõ ràng, dữ liệu, (các) thuật toán và sức mạnh tính toán .

Đầu tiên và quan trọng nhất, ứng dụng AI cần giải quyết vấn đề được xác định rõ ràng (cụ thể) và mong muốn (nhắm mục tiêu các điểm đau cấp bách và rõ ràng của khách hàng) . Hãy nghĩ về các trò chơi khác nhau mà máy tính được dạy để chơi qua 3 làn sóng AI khác nhau:cờ caro, cờ vua, cờ vây. Chúng là những vấn đề được xác định rất rõ ràng và do đó máy tính có thể giải quyết dễ dàng hơn. Nhận dạng khuôn mặt, dịch máy, ô tô không người lái, tối ưu hóa công cụ tìm kiếm, tất cả đều là những vấn đề mong muốn được xác định rõ. Tuy nhiên, việc thiếu các vấn đề mong muốn được xác định rõ ràng là lý do tại sao việc sản xuất một robot dọn nhà nói chung lại rất khó khăn. Các công việc gia đình đơn giản, ví dụ:thu thập cốc và đặt đồ giặt vào giỏ, yêu cầu giải quyết quá nhiều vấn đề. Ví dụ, nó yêu cầu máy xác định những đồ vật cần lấy (cốc, đồ giặt bẩn và đồ giặt chưa sạch, v.v.), đi đâu và đến đó như thế nào (tránh chướng ngại vật trong gia đình và đi đến nơi mong muốn vị trí), xử lý từng đối tượng với công suất mong muốn để nó không làm vỡ cốc hoặc đồ giặt, v.v.

Thứ hai, việc phát triển thuật toán máy học yêu cầu quyền truy cập vào dữ liệu sạch và được gắn nhãn tốt . Điều này là do các thuật toán này được xây dựng bằng cách cung cấp cho các mô hình thống kê khác nhau một lượng lớn dữ liệu được gắn nhãn tốt, để thiết lập các mối quan hệ dự đoán cần thiết. Bài tập thu thập dữ liệu này có thể khó hoặc dễ, tùy thuộc vào ứng dụng thương mại mà bạn đang phát triển. Ví dụ, để thu thập dữ liệu cần thiết cần thiết để phát triển thuật toán thị giác máy tính cho các cánh đồng nho làm rượu vang, công ty khởi nghiệp của tôi cần hình ảnh thực địa từ các vị trí khác nhau với các giống khác nhau và khó hơn nữa - các mùa khác nhau. Với mỗi mùa là một năm, để có được sản phẩm ưng ý sẽ phải mất hàng năm trời. Ngược lại, nếu bạn muốn phát triển một thuật toán nhận dạng khuôn mặt tốt ở Trung Quốc, để thu thập, ví dụ:10 triệu hình ảnh, bạn chỉ cần đặt camera trên một con phố đông đúc ở Bắc Kinh trong một tuần và nhiệm vụ đã hoàn thành. Một ví dụ khác là công cụ tổng hợp tin tức được cá nhân hóa do AI hỗ trợ số 1 ở Trung Quốc, Toutiao, tìm hiểu về sở thích tin tức cá nhân của bạn và chỉ hiển thị cho bạn những tin tức phù hợp nhất với bạn. Trong trường hợp này, việc thu thập dữ liệu lại dễ dàng hơn nhiều, ví dụ:số lượng bài báo bạn đọc trong mỗi danh mục tin tức, lượng thời gian bạn dành cho mỗi bài viết, v.v.

Thứ ba, một doanh nghiệp AI cần phát triển các thuật toán mạnh mẽ và có thể mở rộng . Để đạt được điều này, có ba điều cần phải có:một lượng lớn dữ liệu được gắn nhãn tốt (như đã thảo luận ở trên), tài năng phù hợp và sự tự tin rằng học sâu là công nghệ chính xác để giải quyết vấn đề. Kinh doanh AI cần phải có tài năng phù hợp để phát triển các thuật toán cần thiết, nhưng những thuật toán này có tính chuyên môn cao, đắt tiền và khan hiếm. Ví dụ:khi tôi đang tìm cách thuê cho công ty khởi nghiệp của mình, tôi phát hiện ra rằng, tối thiểu, tôi cần các nhà khoa học dữ liệu (thường là tiến sĩ) để phát triển các nguyên mẫu thuật toán, kỹ sư thiết kế khung, lập trình viên (TensorFlow, Python, C ++, v.v.) để viết mã. vào các chương trình có thể mở rộng và mọi người để kết hợp chúng lại với nhau (quản lý sản phẩm, UX, UI, v.v.).

Một sự cân nhắc khác là sức mạnh tính toán . Tại sao? Bởi vì mạng nơ-ron học sâu đòi hỏi tính toán nhiều hơn so với các phương pháp AI khác. Ví dụ:đối với cùng một nhiệm vụ xác định một con chó trong hình ảnh, việc đào tạo mô hình bằng thuật toán không học sâu có thể cần 10 mô hình thống kê với tập dữ liệu 1GB. Mô hình mạng nơ-ron sâu có thể cần 1000 mô hình thống kê chạy qua tập dữ liệu 100 GB. Kết quả là tốt hơn bằng cách sử dụng mạng, nhưng sức mạnh tính toán yêu cầu lớn hơn nhiều. Do đó, các mô hình này không chỉ yêu cầu một máy tính (giống như những gì chúng ta làm trên máy tính cá nhân của mình), mà là tính toán phân tán với mỗi xử lý GPU, chẳng hạn, 5% tính toán, để 20 GPU cùng có thể xử lý khối lượng tính toán cần thiết. Đổi lại, điều này có nghĩa là phải xây dựng các máy chủ cụm GPU của riêng bạn hoặc thuê sức mạnh tính toán từ các nền tảng như AWS. Công suất tính toán từ điện toán đám mây hoặc máy chủ của riêng bạn rất tốn kém, mặc dù công bằng mà nói, đơn vị chi phí tính toán sẽ liên tục giảm (theo định luật Moore).

Kết luận

Nhiều người tin rằng bây giờ là thời điểm tốt nhất để chứng kiến ​​những đột phá và công ty khởi nghiệp của AI, bởi vì quá trình số hóa của nhiều ngành công nghiệp và internet tiêu dùng làm cho một lượng lớn dữ liệu kỹ thuật số được thu thập có mục đích, được tổ chức sạch sẽ và có sẵn. Sự phát triển của GPU Nvidia và FPGA của Intel làm cho việc thực hiện các phép tính cần thiết rẻ hơn và nhanh hơn nhiều. Do đó, làn sóng đổi mới của AI hiện tại được thúc đẩy bởi những tiến bộ quan trọng trong học sâu .

Nhưng để một ứng dụng AI thành công, người ta cần phải xác định rõ vấn đề mong muốn, dữ liệu, thuật toán và sức mạnh tính toán đáng kể. Đối với các giám đốc điều hành đang đọc bài viết này đang cân nhắc sử dụng AI để trao quyền cho doanh nghiệp của họ, bốn thành phần chính được đề cập ở trên cũng được áp dụng.

Bạn có thể tìm hiểu thêm về AI bằng cách nào? Có rất nhiều sách, hội thảo, khóa học Coursera, tài liệu nghiên cứu và các tổ chức như Học sâu để tìm hiểu về AI. Vì trọng tâm của bài viết này là dành cho các nhà đầu tư muốn biết những kiến ​​thức cơ bản về AI, tôi đã không đề cập đến nhiều chủ đề nóng về AI như tiềm năng của AI như một mối đe dọa, triển vọng tương lai của ngành, đầu tư vào AI, những ưu điểm. và nhược điểm của các thuật toán khác nhau (ví dụ:CNN), tạo mẫu so với mở rộng quy mô, ngôn ngữ lập trình chính, v.v. Trong Phần 2 của loạt bài này, tôi sẽ đi sâu vào cách đánh giá các công ty AI từ góc độ nhà đầu tư.


Tài chính doanh nghiệp
  1. Kế toán
  2. Chiến lược kinh doanh
  3. Việc kinh doanh
  4. Quản trị quan hệ khách hàng
  5. tài chính
  6. Quản lý chứng khoán
  7. Tài chính cá nhân
  8. đầu tư
  9. Tài chính doanh nghiệp
  10. ngân sách
  11. Tiết kiệm
  12. bảo hiểm
  13. món nợ
  14. về hưu