BackMisuse tactics to compromise GenAI systems (Data integrity)

Home/Risks/Marchal2024/Misuse tactics to compromise GenAI systems (Data integrity)

Poisoning

Privacy compromise

Home/Risks/Marchal2024/Misuse tactics to compromise GenAI systems (Data integrity)

Poisoning

Privacy compromise

Misuse tactics to compromise GenAI systems (Data integrity)

Sub-categories (2)

Privacy compromise

"Privacy Compromise attacks reveal sensitive or private information that was used to train a model. For example, personally identifiable information or medical records."

2.2 AI system security vulnerabilities and attacks

HumanIntentionalPost-deployment

Data exfiltration

"Data Exfiltration goes beyond revealing private information, and involves illicitly obtaining the training data used to build a model that may be sensitive or proprietary. Model Extraction is the same attack, only directed at the model instead of the training data — it involves obtaining the architecture, parameters, or hyper-parameters of a proprietary model (Carlini et al., 2024)."

2.2 AI system security vulnerabilities and attacks

HumanIntentionalPost-deployment

Other risks from Marchal2024 (22)

Misuse tactics that exploit GenAI capabilities (Realistic depiction of human likeness)

4.3 Fraud, scams, and targeted manipulation

HumanIntentionalPost-deployment

Misuse tactics that exploit GenAI capabilities (Realistic depiction of human likeness) > Impersonation

4.3 Fraud, scams, and targeted manipulation

HumanIntentionalPost-deployment

Misuse tactics that exploit GenAI capabilities (Realistic depiction of human likeness) > Appropriated Likeness

4.3 Fraud, scams, and targeted manipulation

HumanIntentionalPost-deployment

Misuse tactics that exploit GenAI capabilities (Realistic depiction of human likeness) > Sockpuppeting

4.1 Disinformation, surveillance, and influence at scale

HumanIntentionalPost-deployment

Misuse tactics that exploit GenAI capabilities (Realistic depiction of human likeness) > Non-consensual intimate imagery (NCII)

4.3 Fraud, scams, and targeted manipulation

HumanIntentionalPost-deployment

Misuse tactics that exploit GenAI capabilities (Realistic depiction of human likeness) > Child sexual abuse material (CSAM)

4.3 Fraud, scams, and targeted manipulation

HumanIntentionalPost-deployment

View all 22 risks from this paper →