Code

This repository contains the code and data associated with CoMPosT: Characterizing and Evaluating Caricature in LLM Simulations, our EMNLP 2023 paper. If you have any questions, please contact me at: myra [at] cs [dot] stanford [dot] edu

Code

get_caricature_scores.py: script to run to compute individuation and exaggeration scores for a given dataset of simulations (example usage: python get_caricature_scores.py examples/twitter_mini user comment)
generation_scripts: example scripts to generate simulations in different contexts
topics: lists of topics for each context.
generate_embeddings.ipynb: compute embeddings for output data
individuation_scores.ipynb: reproduce individuation score results
exaggeration_scores.ipynb: reproduce exaggeration score results

Data

data: generated simulations for the Online Forum and Interview contexts

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Code

Data

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
data		data
example		example
generation_scripts		generation_scripts
topics		topics
README.md		README.md
exaggeration_scores.ipynb		exaggeration_scores.ipynb
generate_embeddings.ipynb		generate_embeddings.ipynb
get_caricature_scores.py		get_caricature_scores.py
helper_functions.py		helper_functions.py
individuation_scores.ipynb		individuation_scores.ipynb

myracheng/lm_caricature

Folders and files

Latest commit

History

Repository files navigation

Code

Data

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages