De data scientist maakt gebruik van bestaande tools of ontwikkelt zelf tools voor het automatisch doorzoeken of structureren van big data-bestanden.
Door toepassing van technieken als text mining, topic-extraction, e-discovery en deep learning zorgt hij ervoor dat er verbanden kunnen worden gelegd die voor een mens nauwelijks handmatig te onderscheiden zijn.