В сети появился массивный пиратский архив, который, по всей видимости, содержит почти все песни, когда-либо транслировавшиеся на Spotify, а также данные, охватывающие практически весь каталог платформы. Утечка может оказаться крупнейшим событием в истории музыкального пиратства. Хотя Spotify поспешила закрыть лазейку, позволившую это сделать, до сих пор неясно, можно ли вообще локализовать или удалить этот архив.
Anna’s Archive, поисковая система теневых библиотек, недавно произвела скрейпинг Spotify и создала пиратский архив, содержащий 86 млн песен и метаданные для 256 млн треков.
Активистская группа, заявляющая, что следует по стопам таких теневых библиотек, как Z-Library, с целью сохранения информации и расширения доступа к ней, сообщила, что архив содержит почти всё, что транслировалось на Spotify до июля 2025 года. Метаданные для 256 млн песен представляют 99,9% всего каталога стримингового сервиса, а 86 млн аудиофайлов составляют 99,6% всех прослушиваний. Anna’s Archive закодировала значительную часть музыки в формате OGG с битрейтом 160 кбит/с, однако менее популярные треки доступны лишь с битрейтом 70 кбит/с.
В настоящее время торрент объёмом почти 300 ТБ содержит только метаданные. Anna’s Archive планирует со временем опубликовать дополнительные метаданные вместе с музыкальными файлами, обложками альбомов и файлами, необходимыми для восстановления оригинальных треков. Хотя группа пока выпустила лишь массовый торрент в целях сохранения, она рассматривает возможность включения загрузки отдельных песен.
Spotify подтвердила факт взлома ряду изданий, не уточняя его масштаб. Компания заблокировала аккаунт, связанный с инцидентом, и закрыла лазейку, которую Anna’s Archive использовала для скрейпинга библиотеки.
Проанализировав массив данных, активистская группа опубликовала любопытные выводы о Spotify, включая распределение жанров и популярности песен. Например, значительная часть того, что загрузила Anna’s Archive, по всей видимости, была сгенерирована ИИ, что подтверждает растущее присутствие этой технологии на платформе.
Треки, сгенерированные ИИ, могут стоять за значительным ускорением выпуска новых альбомов, которое произошло после 2019 года. В том году дебютировало около 2 млн альбомов, однако в 2023 году сервис добавил более 10 млн. Более того, тот факт, что 86 млн аудиофайлов, которые группа извлекла, представляют почти все прослушивания, но составляют лишь треть общего каталога Spotify, говорит о том, что большая его часть полностью игнорируется.
По словам хакеров, по меньшей мере 70% песен на Spotify никогда не воспроизводились. Три самые популярные песни получили больше прослушиваний, чем нижние 20–100 млн песен вместе взятые. Кроме того, примерно 34 млн песен имеют пометку explicit, многие композиции существуют в нескольких версиях, а большинство треков на Spotify — это синглы.