"Gdzie leżą moje dane pacjentów?" — to pytanie powinno paść przed podpisaniem każdej umowy z dostawcą AI.
Chmura jest abstrakcyjna z nazwy — ale serwery są fizyczne. Stoją w konkretnym budynku, w konkretnym kraju, podlegając konkretnemu prawu. I właśnie lokalizacja fizyczna serwerów jest pierwszym pytaniem, jakie dyrektor medyczny lub IOD powinien zadać każdemu dostawcy systemu AI.
RODO mówi jasno: dane osobowe obywateli UE nie mogą być transferowane poza Europejski Obszar Gospodarczy (EOG) bez dodatkowych zabezpieczeń prawnych (art. 44–46 RODO). Dla danych zdrowotnych — szczególnej kategorii na mocy art. 9 — wymóg ten nabiera szczególnego znaczenia.
Poniżej omawiamy standardy techniczne i organizacyjne, które definiują bezpieczne przechowywanie danych medycznych w systemach AI — i które powinny być punktem odniesienia w każdej rozmowie z dostawcą.
1. Lokalizacja fizyczna serwerów — data residency w EOG
Data residency oznacza, że dane fizycznie przechowywane są na serwerach w określonej lokalizacji geograficznej. Dla polskich klinik przetwarzających dane pacjentów z użyciem systemów AI — właściwą lokalizacją są data centers zlokalizowane w Unii Europejskiej lub szerzej w EOG.
Główne platformy chmurowe posiadają certyfikowane regiony europejskie:
- AWS (Amazon Web Services): eu-central-1 (Frankfurt), eu-west-1 (Dublin), eu-north-1 (Sztokholm)
- Microsoft Azure: Germany West Central (Frankfurt), North Europe (Dublin), West Europe (Amsterdam)
- Google Cloud: europe-west3 (Frankfurt), europe-west4 (Holandia), europe-north1 (Finlandia)
Pytanie do każdego dostawcy AI: "W jakim konkretnym regionie geograficznym są przechowywane dane moich pacjentów? Czy mam to zagwarantowane umownie?"
2. Szyfrowanie danych — dwa poziomy ochrony
Szyfrowanie danych medycznych w systemach AI odbywa się na dwóch poziomach:
Szyfrowanie w transmisji (data in transit)
Dane przesyłane między voicebotem a serwerami, między serwerami a HIS kliniki, oraz między serwerami a interfejsami administracyjnymi muszą być chronione protokołem TLS 1.3 (Transport Layer Security, wersja 1.3 — standard IETF, RFC 8446, opublikowany 2018). TLS 1.2 jest nadal akceptowany, ale TLS 1.3 oferuje lepszą ochronę i krótszy czas nawiązania połączenia.Szyfrowanie w spoczynku (data at rest)
Dane przechowywane na serwerach (nagrania głosowe, transkrypcje, dane pacjentów, wywiady medyczne) powinny być szyfrowane algorytmem AES-256 (Advanced Encryption Standard, klucz 256-bitowy — standard NIST FIPS 197). Jest to aktualnie uznawany za niemożliwy do złamania praktycznie algorytm symetryczny.Zarządzanie kluczami — HSM
Szyfrowanie jest tak silne, jak zarządzanie kluczami szyfrowania. HSM (Hardware Security Module) to dedykowane urządzenie sprzętowe do bezpiecznego generowania, przechowywania i zarządzania kluczami kryptograficznymi — odizolowane od warstwy oprogramowania. Stosowanie HSM jest rekomendowane przez ENISA (European Union Agency for Cybersecurity) dla systemów przetwarzających dane szczególnej kategorii.
3. Certyfikaty bezpieczeństwa — co weryfikować u dostawcy AI
| Certyfikat | Co potwierdza | Istotność dla kliniki |
|---|---|---|
| ISO/IEC 27001:2022 | System zarządzania bezpieczeństwem informacji — procesy, polityki, kontrole | Fundament — brak tego certyfikatu to sygnał alarmowy |
| ISO 27799:2016 | Bezpieczeństwo informacji w ochronie zdrowia — specyfika medyczna | Bezpośrednio dedykowany sektorowi medycznemu |
| ISO/IEC 27018:2019 | Ochrona danych osobowych w chmurze publicznej | Istotny dla SaaS i platform chmurowych |
| SOC 2 Type II (AICPA) | Niezależny audyt bezpieczeństwa, dostępności i poufności systemów — przez minimum 6 miesięcy obserwacji | Najsilniejszy dowód realnego, nie tylko deklaratywnego bezpieczeństwa |
| Uptime Institute Tier III/IV | Fizyczna infrastruktura data center — redundancja zasilania, chłodzenia, łączności | Gwarantuje dostępność systemu nawet przy awarii komponentów |
4. NIS2 — sektor zdrowia jako podmiot kluczowy
Dyrektywa (UE) 2022/2555 (NIS2), której termin implementacji upłynął 17 października 2024 r., klasyfikuje podmioty opieki zdrowotnej jako podmioty kluczowe lub istotne — w zależności od skali działalności.
Dla klinik objętych NIS2 oznacza to m.in.:
- Obowiązek wdrożenia środków zarządzania ryzykiem cyberbezpieczeństwa — obejmujący dostawców i partnerów (łańcuch dostaw), a więc również dostawców systemów AI
- Obowiązek zgłaszania incydentów do CERT Polska (NASK) — incydenty znaczące w ciągu 24 godzin (wstępne powiadomienie), pełny raport w 72 godziny
- Odpowiedzialność zarządu za nadzór nad politykami cyberbezpieczeństwa
5. Klasyfikacja danych medycznych i pseudonimizacja
Nie wszystkie dane w systemie voicebota wymagają tego samego poziomu ochrony. Prawidłowa polityka bezpieczeństwa zaczyna się od klasyfikacji:
Klasa 1 — Dane publiczne: Godziny pracy kliniki, cennik, informacje o lekarzach (bez prywatnych danych)
Klasa 2 — Dane poufne: Imię, nazwisko, numer telefonu, termin wizyty — dane identyfikacyjne pacjenta
Klasa 3 — Dane ściśle poufne: Dane o zdrowiu, nagrania wywiadu medycznego, diagnozy, leki — art. 9 RODO
VoiceLink stosuje pseudonimizację nagrań głosowych po ich transkrypcji — zastępując identyfikatory pacjenta tokenem w warstwie przetwarzania AI, i przywracając powiązanie z profilem pacjenta wyłącznie w autoryzowanej warstwie dostępowej kliniki. Zmniejsza to ryzyko wycieku danych medycznych w przypadku kompromitacji jednej warstwy systemu.
6. Ciągłość działania — RTO i RPO w medycynie
Dla klinik kluczowa jest nie tylko ochrona danych, ale i ich dostępność. Dwa parametry definiują poziom ochrony ciągłości działania:
- RTO (Recovery Time Objective): Maksymalny czas przywrócenia systemu po awarii. Dla systemów medycznych przyjmuje się RTO ≤ 4 godziny jako standard minimum.
- RPO (Recovery Point Objective): Maksymalny dopuszczalny punkt w czasie, do którego dane są przywracane (maksymalna utrata danych). RPO ≤ 1 godzina dla systemów voicebot oznacza kopie zapasowe co 60 minut.
Lista kontrolna przed podpisaniem umowy z dostawcą AI — pytania o przechowywanie danych
- [ ] W jakim kraju/regionie EU fizycznie przechowywane są dane pacjentów?
- [ ] Czy dostawca posiada certyfikat ISO/IEC 27001:2022 lub ISO 27799:2016?
- [ ] Czy dostępny jest raport SOC 2 Type II? Z jakiego okresu?
- [ ] Jakie algorytmy szyfrowania stosowane są w transmisji (TLS 1.3?) i spoczynku (AES-256?)?
- [ ] Jak zarządzane są klucze szyfrowania — HSM czy software-based?
- [ ] Jakie są parametry RTO i RPO? Jak często tworzone są kopie zapasowe?
- [ ] Czy infrastruktura data center posiada certyfikat Uptime Institute Tier III lub IV?
- [ ] Jak przebiega powiadomienie kliniki w przypadku incydentu bezpieczeństwa?
- [ ] Czy umowa DPA zawiera zobowiązanie do nieudostępniania danych podmiotom spoza EOG?
FAQ — Przechowywanie danych medycznych w systemach AI
Czy dane głosowe (nagrania rozmów) są przechowywane w inny sposób niż dane tekstowe? Nagrania głosowe zajmują znacznie więcej przestrzeni niż transkrypcje tekstowe i mają szczególny status jako dane biometryczne (jeśli używane do identyfikacji). VoiceLink domyślnie przechowuje transkrypcję i metadane rozmowy, a oryginalne nagranie audio poddaje pseudonimizacji i przechowuje je oddzielnie z ograniczonym dostępem — wyłącznie dla celów audytu i obsługi praw pacjenta.
Co się dzieje z danymi pacjentów, jeśli klinika zakończy współpracę z VoiceLink? Umowa DPA powinna zawierać klauzulę o zwrocie i usunięciu danych po zakończeniu umowy — zgodnie z art. 28 ust. 3 lit. g RODO. VoiceLink zobowiązuje się do zwrotu danych w ustrukturyzowanym formacie (CSV/JSON) w ciągu 30 dni od zakończenia umowy i certyfikowanego usunięcia kopii z wszystkich serwerów.
Czy zewnętrzna chmura jest bezpieczniejsza niż własny serwer w klinice? W większości przypadków tak — certyfikowane data centers klasy Tier III/IV oferują wielokrotnie wyższy poziom bezpieczeństwa fizycznego, redundancji i procedur reagowania na incydenty niż typowa serwerownia w prywatnej klinice. Szczegółowe porównanie omówiliśmy w artykule [Bezpieczeństwo danych: chmura vs. serwer lokalny].
Podsumowanie: Bezpieczeństwo danych medycznych to konkretne certyfikaty i parametry — nie deklaracje
"Dbamy o bezpieczeństwo Twoich danych" to zdanie, które znajdziesz na stronie każdego dostawcy AI. ISO 27001, SOC 2 Type II, AES-256, TLS 1.3, EOG, RTO ≤ 2h — to konkretne, weryfikowalne standardy, które odróżniają realną ochronę od marketingowej obietnicy.
Poproś o dokumentację bezpieczeństwa VoiceLink → Udostępnimy aktualny raport SOC 2 Type II, certyfikaty ISO i szczegółowe parametry techniczne infrastruktury — do wglądu przed podpisaniem umowy.

