L’extraction d’informations est la science de transformer les documents textuels du Web en informations structurées qui peuvent être comprises par l’ordinateur. Elle sert notamment à construire des bases de connaissances, qui sont appliquées dans les moteurs de recherche et les assistants intelligents. Un moteur de recherche permet de trouver des pages Web à partir des mots clés. Avec des entreprises comme Google, Microsoft, et Baidu, la recherche est un marché de plusieurs milliards d'euros par an.