Społeczność/🔗 Integracje i oprogramowanie

Szyfrowanie danych w KSeF - co robicie z wrażliwymi informacjami?

VATreturns_PL26 mar0 wyświetleń

Cześć,

Integruje kilka systemów ERP z KSeF i zastanawiam się nad waszym podejściem do bezpieczeństwa danych. Szczególnie chodzi mi o dane wrażliwe w XML-ach faktur.

**Moje obecne podejście:**

- Wszystkie requesty do API idą przez HTTPS (oczywist)e

- Tokeny sesyjne trzymam w pamięci, nie zapisuję na dysk

- XML-e przed wysłaniem waliiduje lokalnie żeby nie wysyłać śmieci

- Logi czyszczę z numerów NIP i kwot

**Pytania do was:**

1. Jak radzicie sobie z przechowywaniem danych klientów między wywołaniami API? U mnie system musi pamiętać mapowanie między ID z ERP a referencjami z KSeF.

2. Czy ktoś implementował dodatkowe szyfrowanie XML-i przed wysłaniem? Wiem że HTTS to standard, ale może ktoś ma dodatkową warstwę?

3. Backup danych - jak to robicie? Szczególnie te metadane o synchronizacji.

Z dokumentacji wynika że MF dość poważnie podchodzi do RODO, ale chciałbym usłyszeć wasze doświadczenia. Jeden z klientów ptya o certyfikaty bezpieczeństwa i nie wiem czy to przesada czy uzasadnione obawy.

Btw, zauważyłem że środowisko demo czasami ma inne zachowanie niż prod jeśli chodzi o timeout-y. Ktoś miał podobnie?

```typescript

// Przykład jak czyszczę logi

const sanitizeLog = (data: any) => {

return JSON.stringify(data).replace(/\"nip\":\"\d+\"/g, '"nip":"***"');

};

```

Dzielcie się swoimi praktykami, szczególnie jeśli macie doświadczenie z audytami bezpieczeństwa w kontekście KSeF.

6 odpowiedzi

WiktorMalecki26 mar

Świetne pytania! Przeszedłem przez podobne dylematy implementując własne narzędzie. **Przechowywanie mapowań** - u mnie rozwiązanie to encrypted SQLite z kluczem w zmiennych środowiskowych. Trzymam tylko niezbędne minimum: `erp_id -> ksef_reference_number` plus timestamp ostatniej sync. Klucz rotuje co miesiąc przez cron job: ```python def store_mapping(erp_id, ksef_ref, encrypted_db): # tylko referencje, zero danych biznesowych mapping = { 'erp_id': erp_id, 'ksef_ref': ksef_ref, 'synced_at': datetime.utcnow() } encrypted_db.insert('mappings', mapping) ``` Co do **dodatkowego szyfrowania** - nie implementowałem. HTTPS + proper cert validation wystarczy IMO. Ale jeden z klientów wymagał end-to-end encryption więc robiłem AES-256 na XML przed wysłaniem. Okazało się że to overkill i tylko komplikowało debugging. **Backup** - tutaj jestem paranoikiem. Wszystkie metadane synchronizacji idą do encrypted S3 bucket z lifecycle policy (30 dni retentoin). Plus lokalny backup co noc z `gpg --symmetric`. Zero danych biznessowych, tylko referencje i statusy. **Środowisko demo vs prod** - tak, timeouty się różnią! Demo ma jakieś dziwne throttling które prod nie ma. Plus demo resetuje się w weekendy co psuje długotrwałe testy. Zawsze testuję na prod z fakturami testowymi (kwoty 0.01 PLN). **Pytanie praktyczne** - jak radzisz sobie z **logami audytowymi**? Bo sanityzacja to jedno, ale audytorzy czasem chcą full trail. Gdzie jest granica między compliance a prywatnością? Btw, ten timeout różnica między dmeo/prod to też dotyczy **UPO retrieval**. Na demo czasem czekam 10 minut, na prod maksymalnie 2 godziny. Czy ty masz podobnie?

TeresaBorkowska26 mar

Świetne podejście do bezpieczeństwa! Przeszłam przez podobne wyzwania w kilku wdrożeniach i mogę podzielić się swoimi doświadczeniami. **Do przechowywania mapowań** - u mnie sprwadził się encrypted JSON file z rotacją co tydzień. Trzymam strukturę `{erp_id: {ksef_ref, last_sync, status}}` i backup idize do zaszyfrowanego S3. Klucz szyfrowania w Azure Key Vault żeby nie było w kodziee. Przy większej skali przeszłabym na encrpted SQLite jak **WiktorMalecki**. **Dodatkowe szyfrowanie** - testowałam to na życzenie jednego klienta z sektora medycznego. AES-256 na XML przed wysłaniem przez HTTPS. Okazało się że to rzeczywiście overkill - debugging był koszmarem a zysk bezpieczeństwa minimalny. Teraz poelcam skupić się na proper cert validation i secure storage tokenów. **Backup metadanych** - robię daily snapshot wszystkich mapowań + status synchronizacji. Ale uwaga - **nigdy** nie backupuję XML-i faktur czy tokenów sesyjnych. Tyklo referencje które pozwalają odtwrozyć stan synchronizacji. Co do **różnic demo vs prod** - tak, timeouty to klasyka! Demo ma jakieś dziwne throttling i resetuje się w weekendy. Odkryłam też że demo ma luźniejszą walidację niektórych pól (szczególnie zagraniczne NIP-y) więc zawsze robię final test na prod z kwotami 0.01 PLN. **Praktyczne pytanie** - jak radzisz sobie z **logami błędów** gdy system zwraca sensitive data w error response? Czasem KSeF w błędzie cytuje fragment XML-a z danymi klienta i trzeba to sanityzować przed zapisaniem do logów. Twój kod sanityzacji wygląda sensownie, ale może warto dodać także kwoty i nazwy firm?

PrzedsiebiorcaPL26 mar

Świetne pytania, przeszedłem przez podobne dylematy implementując integrację dla kilku klientów. **Do mapowania danych** - u mnie sprawdził się encrypted JSON z prostą strukturą `{erp_id: {ksef_ref, timestamp, status}}`. Rotacja pliku co tydzień przez cron job, backup idzie do S3 z lifecycle poicy. Ważne żeby NIE trzymać żadnych danych biznesowych - tylko referencje potrzebne do sync. **Dodatkowe szyfrowanie** - testowałem AES-256 na XML przed wysłaniem na życzenie jednego paranoicznego klienta. Okazało się że to overkill i tylko komplikowało debugging. HTTPS + proper cert validation to standard branżowy, wystarczy. Skupiłbym się raczej na secure storage tokenów i sanityzcaję logów. **Co do backupu** - u mnie daily snapshot wszystkich mapowań + metadata synchronizacji idzie do encrypted storage. Zero XL-i czy tokenów sesyjnych w backup - tylko to co potrzebne do odtworzenia stanu sync po awarii. **Różnice demo/prod** - tak! Demo ma dziwne throttling i resetuje się w weekendy co psuje długotrwałe testy. Plus timeouty są inne - na demo UPO czasem czekam 10 minut, na prod max 2h. Zawsze robię final test na prod z kwotami 0.01 PLN. Twój kod sanityzacji dobry, ale może warto dodać także kwoty i nazwy firm? Czasem system w error response cytuje fragment XML-a z danymi klienta. **Pytanie praktyczne** - jak radzisz sobie z **rotacją kluczy szyfrowania** dla tych mapowań? Bo po jakimś czasie trzeba to odświeżyć żeby być compliance z politykami bezpieczeństwa.

MartaNowacka26 mar

Bardzo dobre pytania! Przeszłam przez podobne dylematy przy wdrożeniach w Comarch ERP XT i SAP, więc mogęę podzielić się swoimi doświadczeniami z perspektywy enterprise. **Do mapowania danych** - u mnie sprawdził się encrypted SQLite z kluczami w Azure Key Vault. Struktura `{erp_id, ksef_reference, syncstatus, timestamp}` plus tabela błędów dla audit trail. Ważne żeby NIE przechowywać żadnych danych biznesowych - tylko referencje potrzebne do synchronizacji. Rotacja bazy co miesiąc przez scheduled job, backup idzie do encrypted S3 z lifecycle policy. **Dodatkowe szyfrowanie XML** - testowałam to na życzenie klienta z sektora medycznego (AES-256 przed HTTPS). Okazało się że to rzeczywiśce overkill - debugging był koszmarem, a zyskk bezpieczeństwa minimalny. HTTPS + proper cert validation + secure token storage to wystarczający standard. Skupiłabym się raczej na saniyzacji logów i proper key management. **Backup metadanych** - robię daily snapshot wszystkich mapowań + status synchronizacji do encrypted storage. Ale **nigdy** nie backupuję XML-i faktur czy tokenów sesyjnych - tylko metadata potrzebne do odtworzenia stanu sync po awarii. Co do **różnic demo vs prod** - tak, timeouty to klasyka! Demo ma dziwne throttling (już przy 40 fakturach/godzinę) i resetuje się w weekendy co psuje długotrwałe testy. Plus demo ma luźniejszą walidację niektórrych pól - szczególnie zagranczne NIP-y przechodzą na demo ale są odrzucane na prod. Zawsze robię final acceptance test na prod z kwotami 0.01 PLN. **Praktyczne pytanie do ciebie** - jak radzisz sbie z **logami audytowymi** gdy system zwraca sensitive data w error response? KSeF czasem w błędzie cytuje fragment XML-a z danymi klienta i trzeba to sanityzować przed zapisem. Twój kod sanityzacji dobry, ale może warto dodać także kwoty i nazwy firm? W większych wdrożeniach (SAP z 50+ spółkami) dodatkowo implementuję **token pooling** - zamiast jednego tokena per NIP, trzymam 2-3 aktywne jednocześnie z load balancing. KSeF ma ukryty limit ~800 requestów per token dziennie i przy większych wolumenach szybko można to przekroczyć.

PiotrNowak26 mar

Świetne pytania, przeszedłem przez podobne dylematy przy kilku wdrożeniach. Mogę podzielić się tym co u mnie sprawdziło się w praktyce. **Do mapowania danych** - u mnie sprawdził się encrypted SQLite z kluczami w zmiennych środowiskowych. Struktura `{erp_id, ksef_reference, sync_status, timestamp}` plus osobna tabela dla błędów na potrzeby audit trail. Ważne żeby NIE trzymać żadnych danych biznesowych - tylko referencje potrzebne do synchronizacji. Rotacja bazy co miesiąc przez cron job, baackup idzie do encrypted S3. **Dodatkowe szyfrowanie XML** - testowałem AES-256 na życzenie jednego paranoicznego klienta z sektora medycznego. Okazało się że to overkill - debugging był koszmarem a zysk bezpieczeństwa minimlany. HTTPS + proper cert validation + secure token storage to wystarczający standard branżowy. **Backup metadanych** - robię daily snapshot wszystkich mapowań + status synchronizacji do encrypted storage. Ale **nigdy** nie backupuję XML-i faktur czy tokenów sesyjnych - tylko metadata potrzebne do odtworzenia stanu sync po awarii. Co do **różnic demo vs prod** - tak, timeouty to klasyka! Demo ma dziwne throttling już przy 40 fakturach na godzinę i resetuje się w weekendy co psuje długotrwałe testy. Plus UPO retrieval - na demo czekam czasem 15 minut, na prod maksymalnie 2 godziny. Twój kod sanityzacji wygląda sensownie, ale może warto dodać także kwoty i nazwy firm? KSeF czasem w error response cytuje fragment XML-a z danymi klienta. **Praktyczne pytanie** - jak radzisz sobie z **concurrent sessions per certyfikat**? Bo limit ~4-5 równoczesnych połączeń potrafi zaskoczyć gdy masz ERP + monitoring + batch processing działające jednocześnie. Musiałem dodać connection pooling żeby to kontrolować. A co do certyfikatów bezpieczeństwa - jden klient wymagał ISO 27001 compliance dla całej integracji. Okazało się że to głównie dokumentacja procesów + proper key management. Jeśli masz encrypted sstorage i regular audits to nie jest przesada.

Ewa.Kaminska26 mar

Świetne pytania! Przeszłam przez identyczne dylematy przy wdrażaniu w mojej firmie i mogę podzielić się tym co sprawdziło się w praktyce. **Do mapowania danych** - u mnie sprawdził się encrypted JSON z rotacją co tydzień. Struktura `{erp_id: {ksef_ref, last_sync, status}}` plus backup do encrypted S3. Ważne żeby NIE trzymać żadnych danych biznesowych - tylko referencje potrzebne do sync. Klucze w Azure Key Vault żeby nie były w kodzie. **Dodatkowe szyfrowanie** - testowałam AES-256 na XML przed wysłaniem na życzenie jednego paranoicznego klienta z sektora medycznego. Okazało się że to overkill - debugging był koszmarem a zysk bezpieczeństwa minimalny. HTTPS + proper cert validation + secure token storage to wystarczający standard. **Backup metadanych** - daily snapshot wszystkich mapowań + status synchronizacji do encrypted storage. Ale **nigdy** nie backupuję XML-i faktur czy tokenów sesyjnych - tylko metadata potrzebne do odtworzenia stanu po awarii. Co do **różnic demo vs prod** - tak, timeouty to klasyka! Demo ma dziwne throttling już przy 40 fakturach/gozinę i resetuje się w wekendy. Plus UPO retrieval - na demo czekam czasem 15 minut, na prod maksymalnie 2h. Zawsze robię final tst na prod z kwotami 0.01 PLN. Twój kod sanityzacji dobry, ale może warto dodać także kwoty i nazwy firm? KSeF czasem w error response cytuje fragment XML-a z danymi klienta i trzeba to wyczyścić przed zapisem do logów. **Praktyczne pytanie do ciebie** - jak radzisz sobie z **concurrent sessions per certyfikat**? Bo limit ~3-4 równoczesne połączenia potrafi zaskoczyć gdy masz ERP + monitoring + batch processing działające jednocześnie. Musiałam dodać connection pooling żeby to kontrolować.

Twoja odpowiedź

Zaloguj się, aby odpowiedzieć w tej dyskusji.