Co to jest blockchain?

Spis treści

1. Co to jest Merkle tree (drzewo Merkle)?
2. Jak działa Merkle tree w blockchain?
3. Zastosowania Merkle tree w różnych kontekstach blockchain
4. Główne zalety i wady użycia Merkle tree
5. Praktyczne zastosowania Merkle tree poza blockchain
6. Porównanie Merkle tree z innymi strukturami kryptograficznymi
7. Wyzwania związane z rozwojem Merkle tree w przyszłości
8. Najczęstsze pytania na temat Merkle tree

Technologia blockchain zrewolucjonizowała sposób, w jaki myślimy o przesyłaniu, przechowywaniu i weryfikacji danych. Jednym z kluczowych elementów, które umożliwiają niezawodność i bezpieczeństwo tej technologii, jest Merkle tree (czasem nazywane również “drzewem Merkle”).

1. Co to jest Merkle tree (drzewo Merkle)?

1.1. Definicja Merkle tree

Merkle tree to rodzaj binarnego drzewa (choć może być też drzewem o innej krotności), w którym każdy węzeł wewnętrzny jest hashem (skrót kryptograficzny) połączonych wartości dzieci. Na najniższym poziomie (liściowym) zazwyczaj znajdują się skróty danych wejściowych, takich jak transakcje w sieci blockchain. Najczęściej używanym algorytmem do tworzenia tych skrótów jest rodzina funkcji SHA-256 (np. w Bitcoinie) lub Keccak (np. w Ethereum), ale w praktyce mogą być stosowane inne funkcje skrótów, w zależności od implementacji.

Struktura drzewa Merkle wygląda następująco:

Na poziomie liści mamy hashe transakcji (np. Hash(Tx1), Hash(Tx2), Hash(Tx3), …).
Każdy węzeł wewnętrzny (rodzic) łączy dwa (lub więcej, w zależności od typu drzewa) hashe swoich dzieci w jedną wartość, np. Hash(Hash(Tx1) || Hash(Tx2)).
Ten proces łączenia i ponownego hashowania trwa aż dojdziemy do “korzenia” drzewa, zwanego Merkle root (korzeń Merkle).

W efekcie, jeden hash — korzeń Merkle — reprezentuje w skróconej formie całą strukturę danych, czyli wszystkie transakcje w bloku.

1.2. Znaczenie Merkle root

Merkle root to hash najwyższego poziomu w drzewie Merkle. Z punktu widzenia blockchaina, jest to niezwykle ważne, ponieważ ten pojedynczy skrót kryptograficzny, zapisywany w nagłówku bloku (block header), reprezentuje wszystkie transakcje zawarte w danym bloku.

Jeśli ktoś chciałby dokonać modyfikacji pojedynczej transakcji, to zmieni się hash na poziomie liścia. W konsekwencji zmieni się również hash rodzica tego liścia, jego rodzica i tak aż po sam wierzchołek drzewa, czyli Merkle root. Dzięki temu weryfikacja integralności danych (transakcji) staje się stosunkowo prosta — wystarczy porównać Merkle root z wartością pierwotną, by stwierdzić, czy ktokolwiek dokonał nieautoryzowanych zmian w drzewie transakcji.

2. Jak działa Merkle tree w blockchain?

2.1. Budowa drzewa Merkle na przykładzie Bitcoina

Aby lepiej zrozumieć mechanizm działania, przyjrzyjmy się prostemu przykładowi budowy Merkle tree w sieci Bitcoin:

Zbieranie transakcji
Górnik (miner) w sieci Bitcoin zbiera transakcje (np. Tx1, Tx2, Tx3, Tx4) do nowego bloku.
Tworzenie hashy poszczególnych transakcji
Każda transakcja jest hashowana, zwykle dwukrotnie (tzw. double SHA-256). W efekcie powstają liście drzewa Merkle: H1 = Hash(Tx1), H2 = Hash(Tx2), H3 = Hash(Tx3), H4 = Hash(Tx4).
Łączenie hashy liści w węzły pośrednie
Węzły wewnętrzne otrzymujemy przez konkatenację i ponowne hashowanie:
- H12 = Hash(H1 || H2)
- H34 = Hash(H3 || H4)
Tworzenie korzenia Merkle
Z kolejnego poziomu węzłów powstaje główny korzeń:
- MerkleRoot = Hash(H12 || H34)
Zapisywanie korzenia Merkle w nagłówku bloku
Ten jeden hash, czyli Merkle root, trafia do nagłówka nowo utworzonego bloku.

Dzięki temu, każdy uczestnik sieci może zweryfikować, czy poszczególne transakcje należą do bloku i czy nie zostały w nim zmodyfikowane.

2.2. Funkcja Merkle root w mechanizmie Proof of Work

W mechanizmie Proof of Work (PoW) — np. w Bitcoinie — górnicy muszą znaleźć rozwiązanie trudnego zadania kryptograficznego (tzw. nonce), aby nadać blokowi poprawny hash (zwany “hash bloku”), który spełni warunki sieci (musi być mniejszy niż określony target).

Hash całego bloku jest liczony nie tylko na podstawie aktualnego nagłówka bloku (zawierającego m.in. poprzedni hash, znacznik czasu, Merkle root, wersję oprogramowania i inne informacje), ale także z uwzględnieniem wartości nonce. Jeśli w tym procesie zmienia się jakakolwiek transakcja w bloku, zmienia się Merkle root, a tym samym hash bloku staje się nieaktualny i cały proces PoW musi zostać wykonany od nowa.

2.3. Proof of Inclusion i weryfikacja częściowa

Jedną z zalet stosowania Merkle tree w blockchain jest możliwość szybkiej i wydajnej weryfikacji, czy dana transakcja rzeczywiście znajduje się w bloku. Mechanizm ten nazywa się Merkle proof lub Proof of Inclusion.

W dużym uproszczeniu polega to na tym, że aby udowodnić obecność transakcji TxA w drzewie, wystarczy dostarczyć hashe “sąsiadujących” węzłów, które prowadzą od danego liścia (transakcji) aż do korzenia. Dzięki temu nie trzeba przesyłać całego bloku ani wszystkich transakcji — wystarczy niewielki zestaw hashy i znany wszystkim Merkle root.

Tę cechę wykorzystują m.in. tzw. węzły lekkie (light nodes), które nie przechowują całej kopii łańcucha bloków, a jedynie nagłówki bloków i pewne dodatkowe informacje niezbędne do weryfikacji transakcji.

3. Zastosowania Merkle tree w różnych kontekstach blockchain

3.1. Bitcoin

Bitcoin to pionierska kryptowaluta, w której drzewo Merkle odgrywa fundamentalną rolę w weryfikacji danych transakcyjnych. Każdy blok Bitcoina zawiera:

Nagłówek z Merkle root,
Listę transakcji,
Nonce i inne informacje dotyczące PoW.

Dzięki Merkle tree możliwe jest korzystanie z lekkich portfeli, które nie muszą pobierać wszystkich transakcji, aby zweryfikować ważność wybranych operacji.

3.2. Ethereum

W przypadku Ethereum mamy również drzewo Merkle (a dokładniej tzw. Merkle Patricia Tree), ale w nieco innej konfiguracji, pozwalającej na utrzymanie stanu kont i inteligentnych kontraktów. Ethereum stosuje drzewo Trie (rodzaj drzewa Patricia) zmodyfikowane w ten sposób, aby hashe przechowywały aktualny stan każdego adresu i kontraktu (w tym sald i kodu kontraktów). Dzięki temu możliwe jest szybkie sprawdzenie i synchronizacja stanu sieci przez węzły.

3.3 Inne sieci blockchain

Wielu twórców nowych blockchainów, czy to publicznych, czy prywatnych (tzw. permissioned), bazuje na zasadzie tworzenia drzew Merkle (lub ich wariantów). Ta uniwersalna struktura danych jest nieoceniona w scenariuszach, w których potrzebna jest:

sprawna weryfikacja niezmienności danych,
potwierdzenie obecności (lub nieobecności) danych w rejestrze,
minimalizacja ilości danych, które muszą być przesłane w celu weryfikacji.

Drzewa Merkle mogą być też wykorzystywane w zdecentralizowanych systemach do przechowywania plików (np. IPFS), w protokołach “off-chain” i rozwiązaniach warstwy drugiej (Layer-2), gdzie całość transakcji niekoniecznie musi być stale zapisywana w łańcuchu głównym.

4. Główne zalety i wady użycia Merkle tree

Zalety

Integralność danych
Korzeń Merkle, przechowywany w bloku, pozwala błyskawicznie wykryć wszelkie nieautoryzowane zmiany w transakcjach.
Skalowalność w weryfikacji
Dzięki Merkle proof nie trzeba pobierać całej historii transakcji ani całego bloku, by potwierdzić obecność pojedynczej transakcji. To umożliwia działanie lekkich węzłów.
Oszczędność miejsca
Przechowywanie i przesyłanie samych hashy (które mają stały rozmiar) jest znacznie bardziej efektywne niż zarządzanie pełną kopią nieustannie rosnącego blockchaina.
Bezpieczeństwo kryptograficzne
Wykorzystanie funkcji SHA-256, Keccak czy innych bezpiecznych algorytmów skrótu utrudnia ataki polegające na modyfikacji danych i tworzeniu kolizji.

Wady

Konieczność przechowywania dodatkowych struktur
Drzewo Merkle samo w sobie jest dodatkową strukturą, którą trzeba obliczać i aktualizować. W praktyce jednak jej utrzymanie w pamięci jest niewielkim kosztem w porównaniu do korzyści, jakie niesie.
Koszty kryptograficzne
Generowanie i weryfikacja dużej liczby skrótów może być kosztowne obliczeniowo, zwłaszcza w sieciach o bardzo dużej przepustowości transakcji.
Złożoność implementacji
Dla początkujących deweloperów koncepcja Merkle tree może być trudniejsza do zrozumienia niż proste tablice lub listy, co zwiększa wymagania projektowe i edukacyjne.

5. Praktyczne zastosowania Merkle tree poza blockchain

Choć Merkle tree jest silnie kojarzone z blockchainem, istnieje wiele obszarów, w których ta struktura danych może okazać się przydatna, zwłaszcza tam, gdzie kluczowa jest weryfikacja integralności i wydajność. Oto kilka przykładów:

Systemy wersjonowania plików
Platformy takie jak Git (choć używa drzew i DAG-ów w nieco inny sposób) bazują na hashowaniu zawartości plików i folderów. Zastosowanie Merkle tree pomagałoby w szybkim porównaniu i wykrywaniu zmian w dużych repozytoriach.
Sieci P2P (Peer-to-Peer)
Protokół BitTorrent wykorzystuje “drzewo haszowe” do weryfikacji fragmentów pobieranego pliku. Odbiorca może szybko stwierdzić, czy pobrany segment jest poprawny, bez konieczności weryfikacji całego pliku.
Systemy backupu i archiwizacji
Merkle tree może być stosowane do tworzenia “sygnatur” backupów, co pozwala na szybkie wykrywanie różnic w kolejnych wersjach kopii zapasowych i efektywne planowanie synchronizacji.
Zdecentralizowane bazy danych
Istnieją projekty baz danych wykorzystujące drzewa Merkle w celu zapewnienia spójności i umożliwienia weryfikacji częściowych replik.

Te przykłady pokazują, że Merkle tree nie jest jedynie “ciekawostką” w blockchainie, ale uniwersalnym narzędziem kryptograficznym i strukturalnym, które rozwiązuje problem przechowywania i weryfikacji danych w środowiskach rozproszonych.

6. Porównanie Merkle tree z innymi strukturami kryptograficznymi

6.1. Hash list vs Merkle tree

Przed pojawieniem się blockchaina, do weryfikacji dużych zbiorów danych stosowano hash list — sekwencję hashy, gdzie każdy element jest hashem kolejnego, co tworzy łańcuch powiązań. Jednak taka linearyzacja nie pozwala na tak efektywną weryfikację fragmentów danych jak Merkle tree i wymaga przejścia całego łańcucha, aby potwierdzić poprawność jednej wartości wewnątrz.

6.2. Bloom filter vs Merkle tree

Bloom filter to probabilistyczna struktura danych, wykorzystywana m.in. do sprawdzania przynależności elementu do zbioru (z pewnym ryzykiem fałszywych pozytywów). Merkle tree natomiast daje gwarancję kryptograficzną co do integralności danych, nie ograniczając się do testu przynależności. W niektórych zastosowaniach obie struktury mogą się wzajemnie uzupełniać.

6.3. Patricia Trie vs Merkle tree

Patricia Trie jest strukturą drzewiastą optymalizowaną do przechowywania kluczy tekstowych (np. w systemach key-value). Ethereum wykorzystuje Merkle Patricia Trie, łącząc ideę skracania ścieżek (patricia) z hashowaniem węzłów (Merkle), co pozwala jednocześnie efektywnie przechowywać i weryfikować dane dotyczące stanu kont i kontraktów.

7. Wyzwania związane z rozwojem Merkle tree w przyszłości

Merkle tree i jego modyfikacje (np. “drzewa kwantoodporne” wykorzystujące bardziej zaawansowane funkcje skrótu) będą prawdopodobnie nadal rozwijane, aby sprostać przyszłym wyzwaniom w dziedzinie bezpieczeństwa i wydajności. Wraz z rozwojem komputerów kwantowych mogą pojawić się nowe wymogi wobec funkcji skrótu.

Jednocześnie prace nad rozszerzeniami blockchainów (np. sharding czy roll-upy w Ethereum) będą stawiały coraz to większe wymagania w zakresie skalowalności, co z kolei może wymuszać usprawnienia sposobu przechowywania i weryfikacji danych w drzewach Merkle.

8. Najczęstsze pytania na temat Merkle tree

Czy można zastosować drzewo Merkle w prywatnym łańcuchu bloków?
Tak. Drzewa Merkle znajdują zastosowanie zarówno w publicznych, jak i prywatnych łańcuchach bloków. Kluczowe pozostaje to, że węzły muszą móc weryfikować integralność danych przy jak najmniejszym koszcie przesyłu i przechowywania.
Co się dzieje, gdy zmieni się jedna transakcja w bloku?
Zmiana choćby jednego bitu transakcji spowoduje zmianę jej hasha, a w konsekwencji zmianę hashy kolejnych poziomów drzewa aż po korzeń (Merkle root). To sprawi, że hash bloku przestanie być ważny i trzeba będzie ponownie wykonać obliczenia PoW (w blockchainie PoW).
Czy Merkle tree jest bezpieczne przed atakami kwantowymi?
Bezpieczeństwo drzew Merkle zależy od bezpieczeństwa funkcji skrótu. W przyszłości, wraz z pojawieniem się komputerów kwantowych, obecne algorytmy hashujące mogą być mniej bezpieczne, ale prowadzone są badania nad “kwantoodpornymi” funkcjami skrótu.
Jak sprawdzić, że dana transakcja nie znajduje się w drzewie Merkle?
Taki dowód (czasem zwany Merkle proof of absence) można uzyskać, jeśli mamy informację o lokalizacji węzła, w którym dana transakcja mogłaby się znajdować, a także ścieżkę skrótów prowadzących do innego liścia. W praktyce częściej interesuje nas jednak potwierdzenie obecności, a nie nieobecności.
Dlaczego węzły w Bitcoinie nie przechowują całego drzewa Merkle, skoro to takie ważne?
Węzły pełne (full nodes) przechowują całe bloki, czyli wszystkie transakcje, więc w każdej chwili mogą odbudować drzewo Merkle, jeśli to konieczne. Natomiast lekkie węzły (SPV, Simplified Payment Verification) przechowują jedynie nagłówki bloków i korzystają z Merkle proof w razie potrzeby.