AugLy 是一个数据增强库,目前支持四种模式(音频、图像、文本和视频)和超过 100 种增强。每个模态的增强都包含在其自己的子库中。这些子库包括基于函数和基于类的变换、组合运算符,并且可以选择提供有关所应用变换的元数据,包括其强度。
我们设计 AugLy 以包含用户在现实生活中在 Facebook 等互联网平台上执行的许多特定数据增强——例如将图像制作成模因、在图像/视频上覆盖文本/表情符号、从社交媒体重新发布屏幕截图。
该库基于 Python,并且至少需要 Python 3.6,因为我们使用数据类。
注意:如果您想在 AugLy 中使用音频或视频模式,您可以使用pip install augly[av]. 否则,安装 withpip install augly只会安装基本要求并且足以使用图像和文本模式,因为如果您不使用它们,音频和视频依赖项会不必要地沉重。
如果在工作中使用AugLy,需要引用:
@misc { bitton2021augly , author = { Joanna Bitton and Zoe Papakipos } , title = { AugLy:音频、图像、文本和视频的数据增强库。} , year = { 2021 } , howpublished = { \url{https://github.com/facebookresearch/AugLy} } , doi = { 10.5281/zenodo.5014032 } }
AugLy 包含四个子库,每个子库对应不同的模态,每个库遵循相同的接口:AugLy 提供了基于函数和类格式的转换,并提供强度函数,帮助了解转换的强度(基于给定参数)。AugLy 还可以生成有用的元数据,以帮助了解数据转换过程。