Reklama cyfrowa to świat, w którym zachowanie prywatności i bezpieczeństwa danych są priorytetowe. Konsumenci, wydawcy i regulatorzy jednogłośnie opowiadają się za zwiększaniem standardów prywatności.
Ale jednocześnie użytkownicy chcą otrzymać spersonalizowane reklamy. Oznacza to, że firmy AdTech muszą strategicznie wdrażać technologie ochrony prywatności (privacy-enhancing technologies, PETs), aby chronić dane użytkowników, szanować ich prywatność i dostarczać spersonalizowane reklamy.
W tym poście opisujemy możliwości jakie technologie ochrony prywatności dają firmom AdTechowym.
Najważniejsze informacje
- Technologie ochrony prywatności (privacy-enhancing technologies, PETs) są kluczowe dla poprawy ochrony danych w branży AdTech, równoważąc prywatność danych i dostarczanie spersonalizowanego doświadczenia reklamowego. PETs przede wszystkim minimalizują ilość zbieranych i przetwarzanych danych oraz maksymalizują ich bezpieczeństwo.
- Większość platform AdTech może wdrożyć differential privacy, multi-party computation, techniki anonimizacji danych oraz rozwiązania pochodne, takie jak data clean rooms.
- Platformy AdTech mogą korzystać z różnych technologii ochrony prywatności, aby zwiększyć ochronę użytkowników.
- Firmy AdTech, takie jak sieci reklamowe, platformy sprzedaży i zakupu reklam (SSP i DSP) oraz giełdy reklamowe, mogą wykorzystać technologie ochrony prywatności, takie jak differential privacy, tokenizacja, szyfrowanie homomorficzne, multi-party computations, uczenie federowane i pseudonimizacja.
Uwaga: Dla uproszczenia w tym artykule będziemy posługiwać się terminem “technologie” ochrony prywatności, w rozumieniu technologii, technik i strategii poprawiających jakość ochrony danych.
Czym są technologie ochrony prywatności
Deloitte definiuje technologie ochrony prywatności (privacy-enhancing technologies, PETs) jako różne “podejścia do ochrony prywatności danych, od organizacyjnych do technologicznych”. Technologie PET integrują elementy kryptografii, sprzętu i metodologii statystycznych, aby chronić przed nieautoryzowanym przetwarzaniem lub udostępnianiem danych konsumentów. Pełnią rolę środków ochronnych, zapewniając bezpieczne obchodzenie się z wrażliwymi informacjami.
Technologie PET pomagają zapewnić bezpieczeństwo danych, skupiając się na trzech aspektach:
- Minimizacja zbierania i wykorzystywania danych osobowych
- Maksymalizacja bezpieczeństwa danych w celu ochrony prywatności konsumentów
- Minimalizacja ilości przetwarzanych danych
Najważniejsze technologie PET związane z AdTech opisaliśmy w naszych poprzednich wpisach: Czym są technologie ochrony prywatności (PETs) w AdTech oraz Korzyści z technologii ochrony prywatności (PETs) w AdTech.
Kluczowe technologie ochrony prywatności (PETs) w AdTechu
Większość platform AdTech może wdrożyć technologie, które obejmują differential privacy (DP), secure multi-party computations (MPC), techniki anonimizacji danych umożliwiających identyfikację jednostki (PII) oraz rozwiązania pochodne, takie jak data clean rooms. Każda z tych technologii pomaga osiągnąć inny cel, co prowadzi do wzmocnienia ochrony danych użytkowników.
Differential privacy (DP): Dodawanie szumu do zebranych danych
Differential privacy (DP) zapewnia ramy dla udostępniania informacji o zbiorze danych bez ujawniania szczegółów dotyczących poszczególnych osób. Techniki differential privacy (DP) wprowadzają statystyczny szum do danych gromadzonych przez wydawców i reklamodawców, zapewniając, że tożsamość użytkowników pozostaje anonimowa, jednocześnie umożliwiając wnioskowanie na zagregowanych danych.
Dla zwiększenia klarowności, differential privacy osiągana jest poprzez wprowadzenie pewnego stopnia losowości do analizy.
W odróżnieniu od konwencjonalnych analiz statystycznych, które obejmują obliczanie średnich, median i równań regresji liniowej, analizy przeprowadzane z wykorzystaniem differential privacy wprowadzają losowy szum podczas obliczeń.
Elementy “losowego szumu” odnoszą się do losowych zakłóceń lub statystycznych wariacji wprowadzanych do obliczeń lub wyników danych, zwykle za pomocą algorytmów lub mechanizmów takich jak szum Laplace’a lub szum Gaussa.
W rezultacie wynik analizy przeprowadzonej z zastosowaniem differential privacy nie jest precyzyjny, ale przybliżony, i jeśli analizę przeprowadzi się wielokrotnie, może dać różne wyniki za każdym razem.
Przykłady zastosowania DP w obszarze AdTech:
- API stworzone w ramach inicjatywy Google Privacy Sandbox
- Apple wdraża differential privacy w swoich systemach, począwszy od wersji iOS 10. Gdy użytkownicy wybiorą udostępnienie danych diagnostycznych i użytkowania, Apple stosuje zasady differential privacy, aby chronić te dane.
- Facebook wykorzystał differential privacy, aby chronić zbiór dostępnych dla badaczy danych, którzy analizowali wpływ udostępniania dezinformacji na wybory.
Secure Multi-Party Computation (MPC): Bezpieczne przetwarzanie danych
Secure Multi-Party Computation (MPC) pozwalają dwóm lub większej liczbie stron wzajemnie wykonywać obliczenia na zbiorach danych bez ujawniania indywidualnych danych wejściowych. Jednak matematyczne protokoły MPC nie próbują ukrywać tożsamości uczestników; to można osiągnąć poprzez dodanie protokołu anonimowej komunikacji.
MPC chroni prywatność, ponieważ strony mogą czerpać wnioski z połączonego zbioru danych bez ujawniania swoich prywatnych informacji.
Przykłady MPC w obszarze AdTech:
- Magnite tworzy synthetic stable IDs, używając zaszyfrowanych danych, aby aktywować dane bez dostępu do surowych zbiorów danych.
- DOVEKEY stworzony przez Google upraszcza aspekty licytacji i aukcji w systemie TURTLEDOVE, wprowadzając niezależny serwer obsługujący klucz-wartość.
- Inicjatywa Interoperable Private Attribution (IPA) prowadzona przez Mozilla i Meta zapewnia środowisko dla mierzenia skuteczności atrybucji bez śledzenia użytkowników.
Techniki anonimizacji, pseudonimizacji, szyfrowania i tokenizacji: Zastępowanie informacji umożliwiających identyfikację jednostki (PII)
Anonimizacja, pseudonimizacja, szyfrowanie i tokenizacja to techniki zastępowania informacji umożliwiających identyfikację jednostki (PII) przez niewrażliwe informacje w postaci tokenów. Tokeny te są tworzone, aby “zabezpieczyć” dane surowe i nie ujawnić ich.
Nazwy technik mogą sugerować podobieństwa lub różnice między nimi. Niemniej jednak, w kontekście branży AdTech ważne jest zrozumienie tych różnic.
Anonimizacja
Anonimizacja polega na przekształcaniu danych w taki sposób, aby już nie identyfikowały one osoby lub nie były w stanie być powiązane z konkretną jednostką. Celem jest całkowite usunięcie wszelkich informacji identyfikujących, sprawiając, że praktycznie niemożliwe jest ponowne zidentyfikowanie konkretnych osób na podstawie danych.
Techniki anonimizacji stosowane w branży AdTech mogą obejmować agregację, maskowanie danych i inne metody, które znacząco zmniejszają ryzyko ponownego zidentyfikowania.
Anonimizacja jest często wykorzystywana przez platformy AdTech do:
- Przeprowadzania analiz statystycznych
- Wykonywania podstawowej segmentacji publiczności
- Generowania wniosków
Szyfrowanie
Szyfrowanie to środek bezpieczeństwa polegający na przekształcaniu danych w zaszyfrowaną postać, często nazywaną tekstem szyfrogramu, który nie może być zrozumiany przez nikogo, kto nie ma klucza do jego odszyfrowania.
W kontekście AdTech, szyfrowanie może być stosowane do zabezpieczania informacji umożliwiających identyfikację jednostki (personally identifiable information, PII), gdy są one przesyłane między systemami lub przechowywane w bazach danych. Szyfrowanie zapewnia, że nawet jeśli dane zostaną przechwycone lub uzyskane bez autoryzacji, pozostaną one nieczytelne i, w rezultacie, bezużyteczne dla atakującego.
Szyfrowanie jest często wykorzystywane przez platformy AdTech do:
- Zabezpieczania przesyłania danych
- Bezpiecznego przechowywania danych
- Dostosowania do regulacji o ochronie danych
Pseudonimizacja
Pseudonimizacja polega na zastępowaniu lub modyfikowaniu PII przez pseudonimy lub aliasy. Oryginalne dane są przekształcane w sposób utrudniający bezpośrednie zidentyfikowanie jednostek, ale wciąż umożliwiający przeprowadzenie określonych rodzajów analiz lub przetwarzania.
Dane pseudonimizowane zachowują potencjał ponownego zidentyfikowania, jeśli pseudonimy są w jakiś sposób skojarzone z oryginalnymi tożsamościami.
Pseudonimizacja jest często stosowana przez platformy AdTech do:
- Wdrażania spersonalizowanej reklamy
- Mierzenia skuteczności kampanii
Tokenizacja
Tokenizacja to metoda zastępowania danych wrażliwych unikalnymi tokenami, które same w sobie nie mają znaczenia ani wartości. Ta technika pozwala na efektywne przetwarzanie i przechowywanie danych bez ujawniania rzeczywistych informacji osobistych.
Platformy AdTech mogą tokenizować PII, takie jak adresy e-mail lub identyfikatory urządzeń, poprzez zastępowanie ich losowymi tokenami.
Tokenizacja jest często stosowana przez platformy AdTech do:
- Wdrażania spersonalizowanej reklamy
- Śledzenia użytkowników
- Mierzenia skuteczności kampanii
Data Clean Rooms (DCR): udostępnianie danych, targetowanie, pomiary
Data clean rooms (DCR) to kontrolowane środowiska, które umożliwiają przeprowadzenie wielu operacji na danych. Głównym DCR jest jednak udostępnianie i analizowanie danych aby wnioskować bez ujawniania surowych informacji.
Obecnie branża AdTech ma dwa główne rodzaje DCR.
Pierwszy rodzaj reprezentowany jest przez Walled Gardens AdTechu – tj. Google, Amazon, Appple i Facebook – z których każdy stworzył włąsny data clean room, dostarczając spółkom korzystającym z ich platform reklamowych zaciemnione i zanonimizowane dane.
Drugi rodzaj reprezentowany jest przez niezależne firmy AdTech, takie jak LiveRamp, Snowflake, Aquilliz i Decentriq, które dostarczają firmom gotowe data clean rooms możliwe do wykorzystania w różnych branżach i kanałach reklamy cyfrowej.
Z rozmów z Juanem Baronem, Dyrektorem ds. Rozwoju Biznesu i Strategii (media i reklama) w Decentriq, oraz Gowthamanem Ragothamanem, CEO Aqilliz, dowiedzieliśmy się, że w przestrzeni reklamy cyfrowej DCR najczęściej używa się do:
- Planowania zakupu mediów
- Retargetingu
- Tworzenia segmentów odbiorców
- Aktywacji odbiorców
- Pomiarów
- Predykcji
- Atrybucji
Technologie ochrony prywatności dla firm adtechowych
Jak wspomnieliśmy wcześniej, integracja technologii PETs na platformach AdTech jest kluczowym elementem zapewnienia ochrony danych użytkowników i przestrzegania ewoluujących globalnych regulacji dotyczących prywatności danych. Inną korzyścią płynącą z przyjęcia tych technologii jest zdobycie przewagi konkurencyjnej na rynku, na którym kwestie prywatności są ważne.
Technologie ochrony prywatności dla sieci reklamowych
Sieci reklamowe mają do dyspozycji kilka technologii ochrony prywatności.
Dzięki wykorzystaniu tokenizacji i DP, sieci reklamowe mogą dostarczać spersonalizowane reklamy, jednocześnie respektując prywatność użytkowników.
Reklama kontekstowa redukuje potrzebę zbierania danych osobowych poprzez wyświetlanie reklam na pasujących stronach internetowych. Differential privacy zapobiega identyfikacji osób podczas analizy raportów. Natomiast tokenizacja zastępuje wrażliwe dane — np. adresy e-mail — niewrażliwymi tokenami, zabezpieczając dane w przypadku naruszeń danych i prób kradzieży tożsamości.
Technologie ochrony prywatności dla DSP
Poprzez wdrożenie data clean rooms, szyfrowania homomorficznego, differential privacy i multi-party computation, DSP mogą zachować równowagę między personalizacją reklam a prywatnością użytkowników.
Platformy, które wykorzystują PETs, takie jak DCR, mogą dostarczać bezpieczne środowisko przetwarzania i analizy danych, zapewniając ochronę wrażliwych informacji użytkowników.
Szyfrowanie homomorficzne umożliwia im wykonywanie obliczeń na zaszyfrowanych danych, bez konieczności odszyfrowania tych danych, zabezpieczając je jednocześnie i umożliwiając ich wykorzystanie do personalizowania reklam.
Podobnie jak w przypadku sieci reklamowych, DSP mogą także wykorzystać DP, wprowadzając do danych statystyczny szum, aby zapobiec identyfikacji osób, jednocześnie umożliwiając znaczącą analizę do celów ukierunkowywania reklam.
MPC umożliwiają wgląd w dane z wielu źródeł bez ujawniania surowych danych.
Technologie ochrony prywatności dla SSP
Poprzez wdrożenie data clean rooms, szyfrowania homomorficznego, differential privacy i multi-party computation, DSP mogą zachować równowagę między personalizacją reklam a Platformy SSP również mogą wykorzystać różnorodne technologie ochrony prywatności, aby zapewnić bezpieczeństwo danych użytkowników przy jednoczesnej optymalizacji przestrzeni reklamowej dla wydawców. Poprzez zastosowanie differential privacy, uczenia federowanego i szyfrowania homomorficznego, SSP mogą skutecznie chronić dane użytkowników przy jednoczesnej optymalizacji serwowania reklam.
Aby agregować i analizować dane użytkowników (np. analizować trendy i zachowania) bez naruszania prywatności użytkowników, SSP mogą wykorzystać DP. Ta technika wprowadza statystyczny “szum” do danych, chroniąc tożsamość jednostek.
Uczenie federowane, czyli zaawansowany algorytm uczenia maszynowego, który umożliwia analizę i przetwarzanie danych na urządzeniu, na którym zostały zebrane, może wzmocnić optymalizację reklam poprzez tworzenie dokładniejszych modeli dostarczania.
Szyfrowanie homomorficzne może chronić dane użytkowników, jednocześnie umożliwiając SSP-om tworzenie zaszyfrowanych profili użytkowników. Te zaszyfrowane profile mogą być wykorzystywane do skutecznego targetowania reklam, podczas gdy podstawowe dane użytkowników pozostają bezpieczne i prywatne.
Technologie ochrony prywatności dla DMP
Platformy danych, w tym platformy zarządzania danymi (DMP), platformy danych klientów (CDP) i data clean rooms, są centralnymi punktami zbierania, integrowania i zarządzania dużymi ilościami strukturalnych i niestrukturalnych danych z różnych źródeł. Ze względu na ich główną funkcję, muszą utrzymywać wysoki poziom ochrony prywatności użytkowników.
Zarówno differential privacy, jak i pseudonimizacja mogą wzmocnić proces segmentacji publiczności i udostępniania danych w DMP. Platformy te mogą wykorzystać PETs do tworzenia anonimowych lub pseudonimizowanych segmentów użytkowników, umożliwiając precyzyjne targetowanie reklam, jednocześnie nie naruszając prywatności indywidualnych użytkowników.
Technologie ochrony prywatności dla giełd reklam
Giełdy reklamowe to cyfrowe rynki, na których kupuje się i sprzedaje miejsca reklamowe od wielu platform DSP i SSP, a ceny są ustalane poprzez aukcje w czasie rzeczywistym (RTB).
Wprowadzenie differential privacy i multi-party computations może pomóc w ochronie wrażliwych informacji użytkowników w trakcie procesu licytacji. Poprzez dodawanie statystycznego “szumu” do danych wykorzystywanych do licytacji, giełdy reklamowe mogą zapewnić, że proces licytacji nie skutkuje wyciekiem wrażliwych informacji użytkowników.
Inne przypadki użycia DP obejmują tworzenie raportów i analizy. Poprzez wykorzystanie DP, dane i wnioski mogą być wyświetlane w taki sposób, aby uniemożliwić identyfikację poszczególnych użytkowników.
Giełdy reklamowe mogą także wykorzystać MPC do dopasowywania reklamodawców i wydawców na podstawie ich kryteriów, bez ujawniania prywatnych informacji któregokolwiek z nich.
Technologie ochrony prywatności dla serwerów reklamowych
Serwery reklamowe przechowują i dostarczają reklamy na strony internetowe i aplikacje oraz dostarczają raporty o wydajności reklam. Dzięki technologiom i technikom differential privacy, szyfrowaniu i uczeniu federowanemu, serwery reklamowe mogą znacznie poprawić prywatność użytkowników.
DP zapewnia, że procesy analizy danych nie ujawnia wrażliwych informacji o użytkownikach.
Szyfrowanie w serwerach reklamowych zabezpiecza dane użytkownika, kodując je w taki sposób, że można do nich uzyskać dostęp tylko za pomocą właściwego klucza deszyfrowania.
Uczenie federowane pozwala na analizę danych bez konieczności dzielenia się samymi danymi, wzmacniając prywatność użytkowników.
Podsumowanie
Wprowadzenie technologii wzmacniających prywatność w branży AdTech to ważny krok w kierunku zwiększenia prywatności użytkowników i zapewnienia bezpieczeństwa danych. Poprawne zastosowanie tych technologii umożliwia platformom dostarczanie skutecznej reklamy, jednocześnie priorytetowo traktując prywatność i bezpieczeństwo danych użytkowników.