Khi nền kinh tế dữ liệu phát triển đến một mức độ nhất định, mọi người sẽ tham gia vào nó một cách rộng rãi và sâu hơn. Khi đó, chắc chắn một điều mọi người đều sẽ tham gia vào các hoạt động lưu trữ dữ liệu khác nhau. Ngoài ra, với sự ra đời của kỷ nguyên Web3, hầu hết các lĩnh vực công nghệ dần bắt đầu nâng cấp hoặc chuyển đổi trong vài năm qua và bắt đầu lưu trữ phi tập trung, với tư cách là cơ sở hạ tầng quan trọng của Web3, nó sẽ được triển khai trong nhiều tình huống ứng dụng hơn trong tương lai. Ví dụ: chúng ta hẳn đã quen thuộc với các mạng lưu trữ dữ liệu đằng sau dữ liệu xã hội, video ngắn, chương trình phát sóng trực tiếp, smart car, v.v. và chúng cũng sẽ áp dụng mô hình lưu trữ phi tập trung trong tương lai.
Dữ liệu là tài sản cốt lõi trong kỷ nguyên Web3 và người dùng sở hữu dữ liệu là tính năng chính của Web3. Việc cho phép người dùng sở hữu dữ liệu và tài sản đại diện bởi dữ liệu một cách an toàn sẽ xua tan mọi lo lắng của người dùng về bảo mật tài sản và giúp hướng dẫn hàng tỷ người dùng tiếp theo truy cập Web. Một layer dữ liệu riêng biệt sẽ là một phần không thể thiếu của Web3.
Từ lưu trữ phi tập trung đến layer dữ liệu sẵn có
Trước đây, dữ liệu được lưu trữ trên cloud thông qua phương pháp tập trung truyền thống và dữ liệu thường được lưu trữ hoàn toàn trên máy chủ tập trung. Amazon Web Services (AWS) là công ty khởi tạo dịch vụ lưu trữ cloud và hiện là nhà cung cấp dịch vụ lưu trữ cloud lớn nhất thế giới. Theo thời gian, nhu cầu của người dùng về bảo mật thông tin cá nhân và lưu trữ dữ liệu tiếp tục tăng lên, đặc biệt là sau khi một số nhà khai thác dữ liệu lớn bị rò rỉ dữ liệu, nhược điểm của lưu trữ tập trung dần xuất hiện và các phương pháp lưu trữ truyền thống không còn đáp ứng được yêu cầu của thị trường hiện tại. Cùng với sự phát triển không ngừng của kỷ nguyên Web3 và sự phát triển của các ứng dụng blockchain, dữ liệu đã trở nên đa dạng và quy mô dữ liệu cũng không ngừng tăng lên. Quan trọng hơn, các yêu cầu về lưu trữ dữ liệu cũng bắt đầu tăng lên.
Lưu trữ dữ liệu phi tập trung (DeFi) ra đời. Lưu trữ phi tập trung là một trong những cơ sở hạ tầng sớm nhất và được quan tâm nhất trong lĩnh vực Web3. Giải pháp sớm nhất có tên là Filecoin ra mắt vào năm 2017. So với AWS, có một sự khác biệt cơ bản giữa tập trung và phi tập trung. AWS đã thiết lập và duy trì trung tâm dữ liệu của riêng mình bao gồm nhiều máy chủ và người dùng có nhu cầu mua dịch vụ lưu trữ có thể thanh toán trực tiếp cho AWS. Lưu trữ phi tập trung tuân theo nền kinh tế chia sẻ (sharing economy), sử dụng các thiết bị lưu trữ cạnh lớn (massive edge storage device) để cung cấp dịch vụ lưu trữ, dữ liệu thực sự được lưu trữ trên bộ lưu trữ do Povider node cung cấp. Do đó, bên dự án lưu trữ phi tập trung không thể kiểm soát những dữ liệu này. Sự khác biệt cơ bản nhất giữa lưu trữ phi tập trung và AWS là liệu người dùng có thể kiểm soát dữ liệu của chính họ hay không. Trong một hệ thống không có sự kiểm soát tập trung như vậy, hệ số an toàn của dữ liệu là rất cao.
Lưu trữ phi tập trung chủ yếu là một mô hình kinh doanh lưu trữ trong đó các tệp hoặc bộ tệp được lưu trữ thành từng phần trong không gian lưu trữ thông qua lưu trữ phân tán. Lý do tại sao lưu trữ phi tập trung lại quan trọng là vì nó giải quyết được nhiều điểm khó khăn khác nhau của cloud lưu trữ tập trung Web2 và phù hợp hơn với nhu cầu phát triển của kỷ nguyên dữ liệu lớn. Nó có thể lưu trữ dữ liệu cạnh phi cấu trúc với chi phí thấp hơn và hiệu quả cao hơn, cung cấp nhiều công nghệ mới nổi (emerging technologie). Do đó, lưu trữ phi tập trung cũng có thể nói là nền tảng cho sự phát triển của Web3.
Hiện tại, có hai dự án lưu trữ phi tập trung phổ biến, một là tạo block và sử dụng kho lưu trữ để khai thác, vấn đề do mô hình này mang lại là việc lưu trữ và tải xuống trên chain sẽ làm chậm tốc độ sử dụng thực tế, thường xảy ra trường hợp mất vài giờ để tải xuống một bức ảnh. Hai là sử dụng một hoặc một số node làm node tập trung, chỉ có thể được lưu trữ và tải xuống sau khi được xác minh bởi các node tập trung, một khi các node tập trung bị tấn công hoặc bị hư hỏng, dữ liệu được lưu trữ cũng sẽ bị mất.
So với dự án đầu tiên, cơ chế phân layer lưu trữ của MEMO giải quyết tốt vấn đề về tốc độ tải xuống của bộ nhớ, khiến tốc độ tải xuống của bộ nhớ đạt được tốc độ chỉ vài giây. So với loại dự án thứ hai, MEMO sử dụng vai trò Keeper để chọn ngẫu nhiên các node xác minh, tránh sự xuất hiện của việc tập trung và đồng thời đảm bảo an ninh. Hơn nữa, MEMO đã tạo ra công nghệ RAFI, có thể cải thiện khả năng sửa chữa nhiều lần và cải thiện đáng kể tính bảo mật, độ tin cậy và tính khả dụng của bộ nhớ.
Tính khả dụng của dữ liệu DA (Data Availability) về cơ bản có nghĩa là các node nhẹ không cần lưu trữ tất cả dữ liệu và duy trì trạng thái của toàn bộ mạng một cách kịp thời mà không cần tham gia vào sự đồng thuận. Đối với các node như vậy, cần có một cách hiệu quả để đảm bảo tính sẵn có và độ chính xác của dữ liệu. Vì cốt lõi của blockchain nằm ở tính bất biến của dữ liệu. Blockchain có thể đảm bảo rằng dữ liệu trong toàn bộ mạng là nhất quán. Để đảm bảo hiệu suất, các node đồng thuận sẽ có xu hướng tập trung hơn. Các node khác cần lấy dữ liệu có sẵn được xác nhận bằng sự đồng thuận thông qua DA. Layer dữ liệu sẵn có độc lập giúp loại bỏ hiệu quả điểm lỗi duy nhất và tối đa hóa bảo mật dữ liệu.
Ngoài ra, các giải pháp mở rộng Layer 2 như zkRollup cũng yêu cầu sử dụng layer dữ liệu sẵn có. Layer 2 với tư cách là layer thực thi sử dụng Layer 1 làm lớp đồng thuận. Ngoài việc cập nhật trạng thái kết quả của các giao dịch hàng loạt lên Layer 1, nó cũng cần đảm bảo tính sẵn có của dữ liệu giao dịch gốc để đảm bảo rằng Layer 2 vẫn có thể được khôi phục khi không có prover sẵn sàng tạo bằng chứng. Trạng thái của mạng sẽ tránh tình huống cực đoan khi tài sản của người dùng bị khóa trong Layer 2. Tuy nhiên, nếu dữ liệu gốc được lưu trữ trực tiếp trong Layer 1, thì nó sẽ vi phạm chức năng của Layer 1 với tư cách là layer đồng thuận trong quá trình mô đun hóa mạng blockchain. Do đó, dữ liệu được lưu trữ trong layer sẵn có dữ liệu độc quyền và chỉ Merkle Tree được tính cho những dữ liệu này được ghi lại trong Layer đồng thuận là một thiết kế hợp lý hơn, và nó cũng là một xu hướng tất yếu lâu dài hơn.
Hình 1 là mô hình layer khả dụng dữ liệu độc lập Layer2 chung được thiết kế bởi Fox Tech.
Celestia dành cho phân tích layer dữ liệu độc lập
Một layer dữ liệu độc lập là một public chain tốt hơn so với một dự án chỉ chịu sự quyết định chủ quan của một nhóm người. Nếu không có sẵn dữ liệu, người dùng có thể bị đe dọa, vấn đề chỉ được giải quyết khi họ trả đủ tiền chuộc để rút tiền từ Layer2.
Vì cơ sở của dữ liệu off chain không đủ an toàn, nên điều gì sẽ xảy ra nếu blockchain được giới thiệu như một chủ thể tin cậy để đảm bảo tính sẵn có của dữ liệu off chain?
Những gì Celestia làm là làm cho lớp dữ liệu sẵn có trở nên phi tập trung hơn, tương đương với việc cung cấp một public chain DA độc lập, với một loạt các node xác minh, block producer và cơ chế đồng thuận để cải thiện mức độ bảo mật.
Layer 2 gửi dữ liệu giao dịch lên main chain Celestia và trình xác minh Celestia xác nhận Merkle Tree của DA Attestation, sau đó gửi nó đến DA Bridge Contract trên Ethereum main chain để xác minh và lưu trữ. Bằng cách này, Merkle Tree của DA Attestation thực sự được sử dụng để chứng minh tính khả dụng của tất cả dữ liệu. DA Bridge Contract trên Ethereum main chain chỉ cần xác minh và lưu trữ Merkle Tree này, đồng thời chi phí cũng giảm đáng kể.
Fraud proof của Celestia là một optimistic proof, miễn là không có ai mắc lỗi trong mạng lưới này thì hiệu quả mang lại cao. Nếu không có gì sai sẽ không có bằng chứng gian lận. Các light node không cần phải làm bất cứ điều gì, miễn là chúng nhận dữ liệu và khôi phục nó theo mã, nếu toàn bộ quá trình chính xác thì optimistic proof vẫn rất hiệu quả.
MEMO dành cho phân tích layer khả dụng dữ liệu độc lập
MEMO là mạng lưu trữ cấp doanh nghiệp có dung lượng cao, tính sẵn có cao trong một thế hệ mới được tạo ra bằng cách tổng hợp các thiết bị lưu trữ edge toàn cầu thông qua các tính năng thuật toán. Nhóm được thành lập vào tháng 9 năm 2017 và chủ yếu nghiên cứu lĩnh vực lưu trữ phi tập trung. MEMO là một giao thức lưu trữ dữ liệu phi tập trung quy mô lớn có độ bảo mật cao và độ tin cậy cao dựa trên công nghệ blockchain point-to-point, có thể thực hiện lưu trữ dữ liệu quy mô lớn. Không giống như lưu trữ tập trung one-to-many, MEMO có thể thực hiện các hoạt động lưu trữ many-to-many mà không cần trung tâm dữ liệu. Trong main chain của MEMO, chủ yếu có các hợp đồng thông minh được sử dụng để ràng buộc tất cả các code, một loạt các hoạt động chính như tải dữ liệu được lưu trữ lên, khớp các node lưu trữ, hoạt động bình thường của hệ thống và hoạt động của cơ chế phạt đều được điều khiển bởi hợp đồng thông minh.
Về mặt công nghệ, trong các hệ thống lưu trữ phi tập trung hiện có, được đại diện bởi Filecoin, Arweave, Storj, v.v., chúng cho phép tất cả người dùng máy tính kết nối và cho thuê không gian đĩa cứng chưa sử dụng của họ để nhận được một khoản phí hoặc token nhất định. Mặc dù chúng đều là lưu trữ phi tập trung nhưng chúng đều có những đặc điểm riêng, sự khác biệt giữa MEMO là nó sử dụng công nghệ mã hóa xóa và sửa chữa dữ liệu để cải thiện chức năng lưu trữ, giúp dữ liệu an toàn hơn, đồng thời giúp lưu trữ và tải xuống hiệu quả hơn. Bởi vì việc tạo ra một hệ thống lưu trữ phi tập trung thuần túy và thiết thực hơn là mục tiêu cuối cùng của MEMO.
MEMO tối ưu hóa cơ chế khuyến khích của Provider đồng thời nâng cao khả năng sử dụng của bộ lưu trữ. Ngoài vai trò User và Provider, Keeper cũng được giới thiệu để ngăn chặn các node bị tấn công. Hệ thống duy trì sự cân bằng kinh tế thông qua sự hạn chế lẫn nhau của nhiều vai trò. Hệ thống có thể hỗ trợ các ứng dụng lưu trữ thương mại cấp doanh nghiệp có dung lượng cao, tính khả dụng cao. Hệ thống có thể cung cấp các dịch vụ lưu trữ cloud an toàn và đáng tin cậy cho NFT, GameFi, DeFi, SocialFi, v.v. và tương thích với WEB2. Sản phẩm của sự kết hợp hoàn hảo giữa blockchain và lưu trữ cloud.