Система Bitcoin представляет собой редкий пример глобальной крупномасштабной платёжной системы, сведения о транзакциях в которой являются общедоступными (хотя и анонимным способом). Мы загрузили полную историю этой системы и проанализировали множество статистических свойств связанного с ней графа транзакций. В этой работе мы впервые дали ответы на множество интересных вопросов относительно типичного поведения владельцев счетов, как они покупают и тратят свои биткоины, какой баланс биткоинов они поддерживают на своих счетах и как они перемещают биткоины между разными счетами в целях лучшей защиты своей приватности. Кроме того, мы выделили все самые большие транзакции в системе и обнаружили, что практически все из них тесно связаны с одной большой транзакцией, которая имела место в ноябре 2010 года, несмотря на то, что пользователи, имеющие к этому отношение, явно пытались скрыть этот факт посредством множества странно выглядящих цепочек и структур разделения-объединения в транзакционном графе.
Введение
Биткоины — это цифровые монеты (прим.перев.: иначе говоря, близкий аналог наличности или обменных ценностей, хотя и существующий в виртуальном, безналичном виде), выпущенные без участия каких-либо правительств, банков или организаций и опирающиеся на криптографические протоколы и распределённую сеть пользователей для своего выпуска, хранения и платёжных операций. Эта система впервые была предложена в 2008 году Сатоши Накамото [1] и была введена в строй в полном объёме в январе 2009. Она привлекла к себе множесто пользователей и значительное внимание СМИ [2], [3], [4], но при этом остаётся трудно дать точный ответ на простые вопросы, такие как: сколько пользователей сейчас в системе? Сколько биткоинов обычно хранят на каждом счету и как этот баланс меняется с течением времени? Принадлежит ли наибольшая часть биткоинов небольшому меньшинству пользователей? Хранят ли они свои биткоины на долговременных счетах или немедленно тратят? Сколько пользователей имеют большой баланс в некоторый момент времени? Каково распределение транзакций биткоинов по размеру и какая часть из них относится к микроплатежам?
В этой работе мы ответили на эти (и многие другие) вопросы. Мы использовали тот факт, что все транзакции, когда либо проходившие через систему Bitcoin, доступны через интернет (в анонимной форме). 13 мая 2012 г. мы загрузили полные общедоступные записи системы, состоящие из примерно 180000 HTML-файлов. После выделения и обработки данных из этих файлов мы построили граф всех биткоин-адресов и транзакций, существовавших на тот момент. Затем мы использовали присущие системе свойства для идентификации множества случаев, для которых мы смогли показать принадлежность множества адресов одному и тому же владельцу и использовали эту информацию для уточнения графа транзакций за счёт объединения данных адресов для получения более полной картины финансовой активности всех участников. После получения нового графа в таком виде мы изучили множество его статистических свойств. В данной работе в серии таблиц мы описываем наиболее интересные и информативные распределения, которые мы нашли. Дополнительно, мы изолировали все большие (≥ 50000 биткоинов) транзакции, которые когда-либо были записаны системой и проанализировали как были накоплены и затем потрачены эти средства. Мы обнаружили, что большинство из всех этих максимальных транзакций, являются потомками одной большой транзакции, включавшей 90000 биткоинов, которая имела место 8 ноября 2010 года и подграфы этих транзакций содержат множество странно выглядящих цепочек и структур разделения-объединения, в которых большие балансы всего переданного за считанные часы проходят через сотни временных промежуточных счетов или разделяются на множество мелких значений, которые рассылаются по разным счетам только для того, чтобы через короткое время снова объединиться в практически такую же сумму на другом счёте.
Предыдущая попытка загрузки и анализа полной истории Bitcoin описана в работе [5]. Они построили граф транзакций на 12 июля 2011 года, что было до того, как система получила реальное распространение. В связи с этим, полное количество биткоин-транзакций в нашем графе примерно в три раза превышает наблюдавшееся в их работе, поскольку их граф главным образом отражает эксперименты, проводимые ранними энтузиастами. Однако, наибольшая разница между той и нашей работой состоит в том, что они в первую очередь интересовались вопросами приватности и показали, что возможна идентификация множества пользователей несмотря на официально заявленную анонимность системы, в то время как мы в первую очередь интересовались статистическими свойствами графа транзакций Bitcoin.
Другой анализ графа транзакций Bitcoin был представлен на конференции Chaos Computer Club в Германии в декабре 2011 [6]. Они снова изначально интересовались тем, как защитить анонимность сети (основываясь на той же идее коллапса адресов, принадлежащих рядовым пользователям), но также включали некоторые интересные комментарии по поводу экономических принципов, стоящих за системой, эффектов утраты монет в результате операций с ними, слабостей протокола и общих топологических свойств графа транзакций.
Данная работа организована следующим образом. Во второй части мы опишем структуру сети Bitcoin. В третьей части мы суммируем основные статистические распределения сети, полученные нами из загруженных данных, которые описывают множество интересных и даже неожиданных свойств системы. Наконец, в четвёртой части мы представляем граф наибольших транзакций и анализируем его странную структуру.
Сеть Bitcoin
Bitcoin — это децентрализованная электронная платёжная система использующая p2p-сеть, цифровые подписи и криптографические доказательства для обеспечения платежей между сторонами без опоры на взаимное доверие. Впервые она была описана в работи Сатоши Накамото (широко распространено мнение, что это имя является псевдонимом) в 2008 году. Платежи осуществляются биткоинами (BTC), которые являются цифровыми монетами, выпускаемыми и передаваемыми сетью Bitcoin. Узлы передают сведения о транзакциях, называемых блоками цепочек, широковещательным способом по всей сети, что впоследствии ведёт к их записи на общедоступных веб-страницах, после их проверки посредством системы доказательства проведения вычислительной работы.
Участники начинают использовать Bitcoin после установки программы, т.н. называемого биткоин-кошелька и создания одного или многих биткоин-адресов. Биткоин-адреса используются для получения биткоинов таким же способом, как и адреса электронной почты используются для получения сообщений. Несмотря на то, что Bitcoin рассматривается как экспериментальная платёжная система, он уже развёрнут в широком масштабе (в том смысле, что текущее число всех выпущенных монет превышает 100000000 долларов США) и привлекает множество внимания со стороны СМИ. Его сторонники утверждают, что это первая подлинно глобальная валюта, которая не дискриминирует своих пользователей по признакам гражданства и местоположения, которая всегда работает без выходных, которую легко защитить без особых пользовательских затрат, которая не требует возвратного учёта для опротестовывания транзакций и др. С другой стороны, недоброжелатели утверждают, что это является широкоиспользуемым средством злоупотреблений с целью покупок нелегальных товаров и отмывания больших сумм денег и кроме того, биткоины могут быть слишком легко украдены из цифровых кошельков посредством кибератак.
В отличие от фиатных денег, которые властями декларируются легальным средством, несмотря на то, что в них нет внутриприсущей ценности и они не обеспечены ценными резервами, система Bitcoin не имеет централизованного центра выпуска. Сеть запрограммирована так, чтобы увеличивать приток денег в соответствии с медленным ростом по геометрической прогрессии до тех пор, пока всеобщее количество биткоинов не достигнет верхнего предела в 21 миллионов BTC. Биткоины возникают как награда Bitcoin-«майнерам» (добытчикам) в ходе решения задач с возрастающей сложностью по проблемам доказательства проделанной вычислительной работы, за счёт чего происходит подтверждение транзакций и предотвращение двойной оплаты. В настоящее время сеть требует более чем в миллион раз больше вычислительной работы на подтверждение одного блока и получения награды (на текущей момент 50 BTC) по сравнению с моментом подтверждения первого блока сети.
Обменный курс Bitcoin широко колеблется в течении лет, от всего лишь $0.01 до свыше $30 за BTC. На сегодня (октябрь 2012 года) он оценивается чуть выше $12 за BTC. Полная активность Bitcoin-сети общедоступна через интернет и эти записи начинаются с цепочки блоков, стартовавших с нулевого блока [7], созданного третьего январа 2009. Каждый блок хранит информацию от небольших значений в пределах от одной до сотен транзакций и содержит гиперссылки на другие блоки с другими данными активности для каждых адресов.
Множество пользователей стараются использовать платёжную систему Bitcoin по политическим или философским мотивам, также как и по прагматическим и малый бизнес начинает принимать биткоины для оплаты своих физических или виртуальных товаров. Подпольный веб-сайт, принимающий только биткоины, известный как Silk Road («Шёлковый путь»), предоставляет пользователям возможность приобретения всех мыслимых видов наркотиков при использовании Tor-сети для защиты своей анонимности [3]. В 2011 году в письме главному уполномоченному прокурору Эрику Холдеру и представителю администрации за контролем оборота наркотиков, сенаторы Чарльз Шумер из Нью-Йорка и Джо Мэнчин из Западной Вирджинии запросили расследование против Silk Road и сети Bitcoin. Шумер описывал использование биткоинов на Silk Road как форму отмывания денег [4]. Вследствие этого, многие обменники Bitcoin, такие как Intersango и Mt. Gox предупредили новых пользователей, что их операции могут стать предметов расследования со стороны правоохранительных органов, а создание новых счетов черех прокси-серверы или Tor может быть временно отклонено и потребовать подписания документов с обязательствами против отмывания денег.
Транзакции в Bitcoin — это обобщение обычных банковских транзакций в том смысле, что они позволяют использовать для одной и той же транзакции множество отправляющих и множество принимающих адресов. Отправитель и получатель транзакций идентифицируются через свои открытые ключи из пар открытый/закрытый ключ, что обозначается как адрес. Таким путём определяется сколько биткоинов берётся с одного отправляющего адреса и как много биткоинов назначается каждому принимающему адресу без детализации того, кто передал кому и сколько. Адрес может получать биткоины с новых сгенерированных адресов или постоянных адресов отправителей. Каждый владелец имеет неограниченное число адресов, связанное с ним. Фактически, считается хорошей практикой для владельца генерировать новый адрес, т.е. пару открытый/закрытый ключ для каждой транзакции. Владельцам рекомендуется предпринимать следующие шаги для лучшей защиты своей идентичности: не раскрывать никакой идентифицирующей информации, связанной со своим адресом; регулярно рассылать меняющиеся части своих запасов BTC самому себе с использованием разных (заново сгенерированных) адресов; и/или использовать доверенную третью сторону для перемешивания своих транзакций с какими-либо ещё владельцами. С другой стороны, некоторые владельцы добровольно раскрывают факт своего владения некоторыми отдельными адресами, например если они рекламируют свои товары и услуги, просят о пожертвованиях или выступают как обменники биткоинов (такие как Mt.Gox, которому принадлежит очень большое число адресов).
Важной особенностью сети Bitcoin являеется то, что транзакции, включающие множество адресов отправителя, могут быть выполнены только общим владельцем всех этих адресов, что определяется в системе Bitcoin как «Кто бы ни был отправителем данной транзакции, он владеет всеми этими адресами». Это законное требование также технически гарантирует факт того, что каждая принятая часть должна иметь криптографическую цифровую подпись, которая открывает доступ в зависимости от предыдущей транзакции. Только лицо, владеющее соответствующим адресом способно создать удовлетворительную подпись и таким образом, финансы могут быть потрачены только своими владельцами. Исходя из этого предположения, является возможным обойти весь список транзакций и объединить множества адресов, обслуживаемых в качестве отправителя единственной транзакции к единственному получателю. Это приведёт к каскаду новых объединений, за которыми мы будет следовать до тех пор, пока список не перестанет сокращаться. Это выдаст множество информации об общем владельце адресов, но не даст гарантии, что два адреса, которые не были объединены в ходе этого процесса, на самом деле принадлежат различным владельцам. За счёт аггрегирования всех адресов и транзакций, которые могут быть оттрасированы к одному и тому же владельцу, мы можем получить более информативную картину его финансового состояния и активности. Если мы располагаем какой-либо дополнительной информацией по поводу реальной собственности любого из этих связанных адресов, мы можем получить более полную картину биткоин-активности данного конкретного индивидуального лица или организации. Например, поскольку WikiLeaks открыто опубликовала один из своих адресов с целью запроса пожертвований, мы смогли определить, что WikiLeaks имеет по крайней мере ещё 83 адреса, вовлечённых по крайней мере в 1088 транзакций и имеет в ходе всех этих транзакций накоплений на сумму 2605.25 BTC.
Мы получили полное состояние транзакций сети Bitcoin на момент 13 мая 2012 года, в котором содержатся все выполненные системой транзакции с момента начала 3 января 2009 и до этой даты. Для этого потребовалось загрузить 180001 разных, но связанных HTML-файлов, начиная с блока 180000 [8] и следуя по ссылкам обратно к нулевому блоку, который инициализировал систему в январе 2009. Каждый файл был разобран для извлечения всех транзакций мультиотправителя/мультиполучателя и затем набор транзакций был кодирован как стандартная база данных на нашем локальном компьютере. Затем мы запустили вариант алгоритма поиска пересечений в графах [9] с целью объединения всех адресов, про которые известно, что они принадлежат одному владельцу и скомбинировали все транзакции, которые таким образом оказались с ним ассоциированы (но без исключения внутренних платежей, которые превратились в самозамкнутые петли на графе). Все статистические данные, которые мы описывает в следующем разделе, получены из этого сокращённого графа, а не из оригинальном графа, который был извлечён из исходных данных HTML-файлов.
Статистика, рассчитанная на основе графа транзакций Bitcoin
На момент загрузки графа в нём было 3730218 открытых ключей, каждый связанный с отдельным адресом: 3120948 из них были вовлечены в качестве отправителя хотя бы в одну транзакцию, в то время как другие 609270 принадлежат к числу только принимающих биткоины. Путём запуска алгоритма объединения-поиска, мы смогли ассоциировать 3120948 адресов с 1851544 различными владельцами. Поскольку другие 609270 адресов никогда не использовались в качестве отправителей, они не могут быть объединены ни с какими другими адресами посредством алгоритма объединения-поиска и таким образом все они были оставлены как принадлежащие разным владельцам с единственным адресом. При добавлении этих одноэлементных множеств мы получили 2460814 возможных различных владельцев, что подразумевает, что каждый из них в среднем имеет 1.5 адреса. Однако, в статистике имеются существенные вариации, так есть один владелец с 156722 различными адресами. Анализируя некоторые из этих адресов и следуя за их транзакциями, легко определить, что их владельцем является Mt.Gox — один из наиболее популярных сайтов обмена биткоинов (ответственный за более чем 90% обменных операций в сети). Полное описание количества адресов по владельцам показано в таблице 1.
Больше или равно |
Меньше |
Количество владельцев |
1 |
2 |
2,214,186 |
2 |
10 |
234,015 |
10 |
100 |
12,026 |
100 |
500 |
499 |
500 |
1,000 |
35 |
1,000 |
5,000 |
41 |
5,000 |
10,000 |
5 |
10,000 |
50,000 |
5 |
50,000 |
100,000 |
1 |
100,000 |
1 |
Таблица 1. Распределение количества адресов по владельцам
В нашем сокращённом графе транзакций, каждая m-к-n-транзакция состоит из единственного отправителя (поскольку адрес отправителяm должен принадлежать тому же отправителю) и по крайней мере n получателям. Таким образом, это можно представить как декомпозицию по крайней мере n различных транзакций от единственного владельца m отправителей к владельцам n получателей. В случае когда некоторые принимающие адреса идентифицируются как совместно используемые общим владельцем (использование карты владельцев адресов), их накопления складываются для создания единой общей транзакции, и если некоторые из получателей идентифицируются по единому отправителю, то мы создаём единую самозамкнутую петлю с комбинированным объёмом накоплений. Результирующий граф содержал 7134836 транзакций от единичных отправителей к единичным получателям, из которых 814044 (около 11%) включали Deepbit (крупнейший пул майнинга биткоинов) и 477526 (около 7%) относились к Mt.Gox. Около 10% транзакций было самозамкнутыми петлями. Граф транзакций не является связным и составлен из 133742 различных связанных компонентов, многие из которых имеют единичный размер. Например, есть 43710 компонентов (около 33%), складывающихся в единственный адрес, который используется только для приёма (одного или нескольких пакетов) свежесгенерированных биткоинов, каждый из которых ранее никогда не участвовал в исходящих или входящих транзакциях.
Существует множество типов статистических данных и графиков, касающихся сети Bitcoin, которые могут быть легко загружены через интернет [10], [11]. Однако эти типы статистичесих данных пытаются описать некоторые глобальные свойства сети в течении времени, такие как количество ежедневных транзакций, их общий объём, количество сгенерированных биткоинов и курсы обмена между биткоином и долларом. Мы можем продвинуться в этом дальше, поскольку полный граф транзакций может быть использован для определения финансовой истории каждого пользователя, включая всю его активность по отправкам и получению, также как и ежедневный баланс биткоинов на его адресах и то как эти показатели меняются во времени. Имея в распоряжении этот граф у нас появляется возможность изучать статистические свойства сети, которые нелегко определить следуя небольшому количеству онлайн-ссылок в Blockexplorer-репрезентации сети Bitcoin. В оставшейся части данного раздела мы опишем то, что нам уже удалось найти, но мы ожидаем более глубокого и тщательного анализа данных в ближайшем будущем.
Здесь мы сталкиваемся с нашим первым удивительным открытием. Полное количество биткоинов в системе является линейным в номерах блоков. Каждый блок ассоциирован с генерацией 50 новых биткоинов и таким образом 9000050 BTC на нашем графе владельцев (сгенерированных с блока 180001 между нулевым и 180000 блоками). Однако, если мы просуммируем количество, накопленное на 609270 адресах, которые только принимали и никогда не посылали биткоины, то мы увидим, что их владельцы создали на стороне нечто вроде «запасных счетов» на 7019100 BTC, что представляет собой сумму, составляющую почти 78% всех существующих биткоинов. 59.7% всех коинов (монет) — это «старые коины», которые были приняты более чем за три месяца до даты нашего исследования (13 мая 2012 года) и они до сих пор не участвовали ни в каких транзакциях. Это означает, что количество циркулирующих во всех транзакциях биткоинов значительно меньше, чем считалось ранее. Общее количество биткоинов, вовлечённых во все транзакции с момента запуска системы (не считая текующих операций по выпуску) составляет 423287950 BTC. Это значит, что каждый коин, который фигурирует в циркуляции, делает свой оборот много большее число раз, чем это ожидалось ранее.
Другая интересная находка заключается в том, что общее количество биткоинов, получаемых большинством владельцев, несущественно. Как мы можем видеть из таблицы 2, 36% всех владельцев получили менее одного BTC (около 12 долларов по курсу на момент данной публикации) за всё время своего существования, 52% получили менее 10 BTC и 88% менее 100. На другой стороне распределения только четыре владельца, которые получили свыше 800000 BTC и 80 владельцев, которые получили свыше 400000.
Больше или равно |
Меньше |
Количество владельцев |
0 |
1 |
893,763 |
1 |
10 |
389,302 |
10 |
100 |
881,273 |
100 |
1,000 |
255,826 |
1,000 |
10,000 |
36,713 |
10,000 |
50,000 |
3,593 |
50,000 |
100,000 |
181 |
100,000 |
200,000 |
55 |
200,000 |
400,000 |
30 |
400,000 |
800,000 |
76 |
800,000 |
4 |
Таблица 2. Распределение поступающих накоплений в BTC по владельцам
Аналогично, как видно из таблицы 3, на момент 13 мая 2012 года баланс почти 97% всех владельцев был меньше 10 BTC. Это число снижается до 88% если вместо рассмотрения одного конкретного момента мы рассмотрим максимальный баланс, когда либо наблюдавшийся за весь период существования владельца. Эта статистика собрана в таблице 4. В дополнение можно увидеть, что только 78 владельцев имели текущий баланс свыше 10000 BTC. Это число возрастёт до 3812 если рассматривать максимально наблюдавшиеся значения балансов.
Больше или равно |
Меньше |
Количество владельцев |
0 |
0.01 |
2,097,245 |
0.01 |
0.1 |
192,931 |
0.1 |
10 |
95,396 |
10 |
100 |
67,579 |
100 |
1,000 |
6,746 |
1,000 |
10,000 |
841 |
10,000 |
50,000 |
71 |
50,000 |
100,000 |
5 |
100,000 |
200,000 |
1 |
200,000 |
400,000 |
1 |
400,000 |
0 |
Таблица 3. Распределение текущего (на 13 мая 2012 г.) баланса в BTC по владельцам
Больше или равно |
Меньше |
Количество владельцев |
0 |
0.1 |
547,763 |
0.1 |
10 |
668,247 |
10 |
100 |
945,083 |
100 |
1,000 |
259,142 |
1,000 |
10,000 |
36,769 |
10,000 |
50,000 |
3,513 |
50,000 |
100,000 |
163 |
100,000 |
200,000 |
40 |
200,000 |
400,000 |
26 |
400,000 |
500,000 |
68 |
500,000 |
2 |
Таблица 4. Распределение максимально наблюдавшегося баланса в BTC по владельцам
Другой показатель, который может указывать на уровень активности пользователя — это количество транзакций, в которые он был вовлечён. Это распределение показано в таблице 5. Примечательно, что 97% всех владельцев осуществили менее 10 транзакций на каждого, в то время как 75 владельцев используют сеть очень часто и связаны по крайней мере с 5000 транзакций.
Больше или равно |
Меньше |
Количество владельцев |
1 |
2 |
557,783 |
2 |
4 |
1,615,899 |
4 |
10 |
222,433 |
10 |
100 |
55,875 |
100 |
1,000 |
8,464 |
1,000 |
5,000 |
287 |
5,000 |
10,000 |
35 |
10,000 |
100,000 |
32 |
100,000 |
500,000 |
7 |
500,000 |
1 |
Таблица 5. Распределение количества транзакций по владельцам
Мы также подсчитали распределение транзакций в Bitcoin и обобщили в таблице 6. И снова, это свидетельствует, что множество транзакций крайне мало: 28% меньше, чем 0.1 BTC. Система Bitcoin позволяет осуществлять микротранзакции, имеющие порядок 10-8BTC (это наименьшая часть на которую может быть разделён биткоин, её называют сатоши). Если мы также примем во внимание средние значения, то увидим, что 73% транзакций включают менее 10 BTC. С другой стороны, большие транзакции являются редкими в Bitcoin: наличествует только 364 транзакции, размером больше 50000 BTC. Мы тщательно проанализировали эти транзакции и описали наши находки в следующем разделе.
Больше или равно |
Меньше |
Количество транзакций |
0 |
0.001 |
381,846 |
0.001 |
0.1 |
1,647,087 |
0.1 |
1 |
1,553,766 |
1 |
10 |
1,628,485 |
10 |
50 |
1,071,199 |
50 |
100 |
490,392 |
100 |
500 |
283,152 |
500 |
5,000 |
70,427 |
5,000 |
20,000 |
6,309 |
20,000 |
50,000 |
1,809 |
50,000 |
364 |
Таблица 6. Распределение размера транзакций в Bitcoin
Интересно исследовать активных пользователей Bitcoin, которые имеют максимальные входящие BTC или максимальное количество транзакций. 19 таких пользователей показаны в таблице 7, отстортированные в порядке уменьшения количества накопленных входящих биткоинов, показанных в третьем столбце. Самый левый столбец связан с владельцами буквами от A до S, из которых три идентифицированы как: B — MT.Gox, G — Instawallet и L — Deepbit. Восемь дополнительных владельцев: F, H, J, M, N, O, P и Q показаны на графе наибольших транзакций (рис. 1), который показан в следующем разделе. Второй столбец показывает количество адресов, объединённых с каждым владельцем. Четвёртый столбец показывает количество транзакций, в которые вовлечён владелец.
ID владельца |
Количество адресов |
Количество входящих BTC |
Количество транзакций |
A |
78,251 |
2,886,650 |
246,012 |
B (Mt.Gox) |
156,722 |
2,206,170 |
477,526 |
C |
13,289 |
941,013 |
77,525 |
D |
12,520 |
867,996 |
48,347 |
E |
191 |
692,864 |
1,353 |
F |
12 |
660,000 |
23 |
G (Instawallet) |
23,649 |
633,606 |
92,593 |
H |
9 |
580,000 |
59 |
I |
10,561 |
514,066 |
49,550 |
J |
4 |
500,021 |
6 |
K |
134 |
479,254 |
1,039 |
L (Deepbit) |
2 |
452,929 |
814,044 |
M |
9 |
442,000 |
10 |
N |
128 |
432,161 |
137 |
O |
10 |
432,286 |
14 |
P |
1 |
432,078 |
3 |
Q |
14 |
430,490 |
23 |
R |
2,124 |
321,866 |
300,486 |
S |
1,037 |
20,308 |
197,334 |
Таблица 7. Список наиболее активных пользователей bitcoin, которые имеют максимальное количество входящих BTC или максимальное количество транзакций. Некоторые из символов в левом столбце: F, H, J, M, N, O, P и Q указаны красным на рис.1
Таблица 7 показывает, что максимальное количество адресов было у Mt.Gox, но не наибольшее количество входящих биткоинов и не наибольшее количество транзакций. Владелец A в первом столбце таблицы 7 владеет следующим большим количеством адресов, около 50% от Mt.Gox, но принял на 31% больше, чем Mt.Gox. Deepbit отправил на 70% больше транзакций, чем Mt.Gox. Интересно, что количество адресов этих 13 владельцев — это более пятой части всего выполненного ими количества транзакций, что может указывать на то, что каждый адрес в действительности обслуживает лишь небольшое количество транзакций. Также ясно, что 6 из 19 владельцев в таблице послали каждый менее 30 транзакций с общим количеством свыше 400000 BTC. Поскольку эти владельцы использовали большие транзакции, мы можем изолировать их и следовать за потоком их транзакций, см. далее в 4 части. С другой стороны, владелецA никогда не посылал никаких больших транзакций и таким образом не был включён в наш граф наибольших транзакций.
Граф наибольших транзакций в Bitcoin
Мы идентифицировали и проанализировали все самые большие (≥ 50000 BTC) транзакции в системе Bitcoin (всего 364 таких транзакций, как указано в последнем столбце таблицы 6) и следовали их течению. Мы начали с самой ранней транзакции такого рода, среди 90000 BTC 8 ноября 2010. Отслеживая каждые из 363 больших транзакций в этой категории, мы смогли показать, что 348 были явными продолжателями этой начальной транзакции. Получившийся прямой граф показан на рис. 1. Этот граф раскрывает множество характерных особенностей потока Bitcoin транзакций: долгие последовательные цепочки транзакций, паттерны разделения-слияния, которые могут включать самозамкнутые петли, отходы в сторону от BTC и финальное распределение больших сумм в виде древовидной структуры.
Длинные цепочки. Часто отмечающейся практикой владельцев биткоинов является создание цепочек последовательных транзакций, как можно видеть на рис. 7: начальное значение быстро передавалось от одного адреса к другому, с небольшими остатками. Примечательно, что некоторые из транзакций в этой цепочке выведены через Mt.Gox. Дополнительные цепочки такого рода можно найти на рис. 2, рис. 4 и рис. 5 с длиной 3, 15, 23, 26, 80 и 88 транзакций. Как видно, рис. 3 показывает заметное отличие от этого паттерна, т.к. то же значение 5000 BTC многократно повторно отделяется от основной суммы и распределяется по счетам, которые не имели с ней дополнительных связанных транзакций.
Паттерны разделения-слияния и самозамкнутые петли. Другим частым сценарием в Bitcoin является передача большого числа биткоинов с одного адреса на другой через множество промежуточных адресов, каждый получающий часть целой суммы, а затем пересылающий её, по большей части полностью, в том же самом направлении, как напрямую, так и с помощью других посредников. Примеры можно увидеть на рис. 6, рис. 8 и рис. 9. Более сложный паттерн разделения-слияния показан на рис. 5: владелец посылает 90000 BTC сам себе три раза по самозамкнутым петлям. Каждый раз он разделяет сумму на различные значения, 76+14, 72+18 и 69+21. Он использует тот же адрес для малых сумм и различные адреса для больших. Затем он обменивает все 90000 BTC на Mt.Gox. Наконец, 90000 BTC переданы через цепь 90 транзакций с использованием 90 различных адресов (которые могут принадлежать, а могут и не принадлежать одному владельцу), где каждые 1000 BTC посылаются обратно первому владельцу, рекомбинируются практически в первоначальное значение 90000 BTC.
Удержание биткоинов на «сохранных счетах». Другая долговременная цепочка транзакций началась в марте 2011, см. рис. 3. Она отличается от вышеприведенных, поскольку 28 из 30 её шагов отводят 5000 в нечто выглядящее как «сохранные счета». Накопленная сумма в 140000 BTC более никогда не была видна после этого момента. Эти биткоины являются примером нашего открытия того, что большая часть биткоинов не циркулирует в системе.
Распределения, схожие с двоичными деревьями. Часто суммы BTC распределяются по множеству адресов разделением их на два схожих счёта на каждом шаге. Этот результат в виде двоичной древообразной структуры показан на рис. 10 и рис. 4.
Выводы
Система Bitcoin — самая известная и наиболее широко распространённая альтернативная платёжная система, но при этом достаточно сложно собрать точную информацию о её использовании на практике. В данной работе было описано большое число статистических свойств графа транзакций Bitcoin, который содержит все транзакции, которые прошли до 13 мая 2012. Мы определили, что большинство добытых биткоинов остаются неактивными на адресах, которые никогда не участвовали ни в каких исходящих транзакциях. Мы нашли, что существует большое число мелких транзакций, в которых перемещаются только малые части одного биткоина, но также и сотни транзакций, в которых перемещаются свыше 50000 биткоинов. Мы проанализировали все эти большие транзакции, следуя деталям пути, которым эти суммы были накоплены, распределены и реализованы так что большинство из этих больших транзакций были потомками одной большой транзакции, проведённой в ноябре 2010. Наконец, мы отметили, что подграф, который содержит эту большую транзакцию с её соседями имеет на её протяжении много странно выглядящих структур, которые могут быть попытками сокрытия фактов существования и связи между этими транзакциями, однако такие попытки могут быть достаточно успешно преодолены путём следования за денежным следом.
Благодарности. Исследование проведено при поддержке Citi Foundation. Выражаем благодарности Ronen Basri, Uriel Feige, Michal Irani, Robert Krauthgamer, Boaz Nadler, Moni Naor и David Peleg с кафедры компьютерных наук и математики Института Вейцмана за множество интересных и информативных дискуссий. Также благодарим Аарона Фридмана за большую помощь в составлении и обработке базы данных Bitcoin. Наконец, мы рады поблагодарить всех членов сообщества Bitcoin, в частности Мени Розенфельд и Стефана Рихтера, которые прислали замечательные комментарии, критику и пожелания. Мы пересмотрели изначальную версию работы с целью отметить их вклад.
Иллюстрации
Рис. 1. Скелет графа наибольших транзакций системы Bitcoin (которые включали более 50000 BTC). Красными буквами отмечены наиболее активные владельцы биткоинов, упомянутые в табл. 7.
Рис. 2. Подграф рисунка 1: обратное отслеживание некоторых потоков BTC, приведших к первой большой транзакции 90000 BTC 8 ноября 2010.
Рис. 3. Подграф рис.1: длинная цепочка транзакций, в которой каждый адрес размещает на стороне некоторое небольшое количество BTC.
Рис. 4. Подграф рис. 1: длинная цепочка транзакций, в которой каждый адрес передаёт большую часть своих BTC дальше по цепи. Остаток распределяется в виде структуры, похожей на двоичное дерево.
Рис. 5. Подграф рис. 1: владелец посылает 90000 BTC сам себе через самозамкнутую петлю, затем отправляет их дальше, но возвращает обратно 90 транзакций, каждая по 1000 BTC, всё произведено в один день. 31000 из этого передана дальше.
Рис. 6. Подграф рис. 1: большие количества BTC передавались с одного адреса на другой, пересылаясь частями через промежуточные адреса, затем они были объединены на одном и том же месте назначения.
Рис. 7. Подграф рис. 1: большие количества BTC быстро передавались через очень длинные цепочки из сотен транзакций за очень короткий промежуток времени.
Рис. 8. Подграф рис. 1: Очень большие количества BTC передавались разделением на равные количества, каждое из которых направлялось на разные адреса, принадлежащие одному владельцу, затем большая часть накопленной суммы отправилась одному получателю.
Рис. 9. Подграф рис. 1: схожий сценарий, как и показанный на рис. 8, но с большим количеством промежуточных адресов.
Рис. 10. Подграф рис. 1: наибольшее количество переданных BTC в конечном итоге распределилась среди множества адресов посредством структуры, схожей с двоичными деревьями.
Библиография
- Nakamoto, S.: Bitcoin: A Peer-to-Peer Electronic Cash System, 2008.
- Wallace, B.: The Rise and Fall of Bitcoin, Wired Magazine, 23 November 2011, http://www.wired.com/magazine/2011/11/mf_bitcoin/all/
- NPR Staff: Silk Road: Not Your Father’s Amazon.com, 12 June 2011, http://www.npr.org/2011/06/12/…..r-fathers-amazon-com
- Brett, W.:Senators seek crackdown on ”Bitcoin” currency, Reuters, 8 Jun 2011, http://www.reuters.com/article…..dUSTRE7573T320110608
- Reid, F., Harrigan M.: An Analysis of Anonymity in the Bitcoin System, arXiv:1107.4524v2 [physics.soc-ph] 7 May 2012.
- Hamacher, K., Katzenbeisser, S.: Bitcoin – An Analysis, 29 Dec 2011, http://www.youtube.com/watch?v=hlWyTqL1hFA
- Bitcoin’s block number 0, http://blockexplorer.com/b/0
- Bitcoin’s block number 180,000, http://blockexplorer.com/b/180000
- Cormen, T.H., Leiserson, C.H., Rivest, R.L., Stein, C.: Introduction to Algorithms, Second Edition. MIT Press and McGrawHill, 2001. Chapter 21: Data structures for Disjoint Sets, pp. 498-524.
- Forbes: Top 10 Bitcoin Statistics, http://www.forbes.com/sites/jo…..-bitcoin-statistics/
- Block chain: Bitcoin charts http://blockchain.info/charts
Источник pgpru.com