Robeco, The Investments Engineers
blue circle

21-03-2023 · Visión

Quant chart: how NLP can anticipate GICS changes

The recent changes to the global industry classification standards (GICS) illustrate their rigid and sluggish nature. This article argues that natural language processing (NLP) techniques can offer additional insights in today’s fast-changing market environment.


  • Matthias Hanauer - Researcher

    Matthias Hanauer


  • Rob Huisman - Researcher

    Rob Huisman


The GICS is the classic framework to classify similar firms into sectors, industry groups, industries and sub-industries. But the GICS methodology is rigid. Revisions are infrequent and take years to implement, as they involve extensive consultations with market participants. As a result, alternative methods of classification have been suggested based on customer-supplier data, textual similarities in companies’ 10-K business descriptions, comparable technologies based on patent data or shared analyst coverage.

One of the major changes in the recent GICS revision is the creation of the new sub-industry transaction and payment processing services under the financials sector. This new sub-industry will include companies such as Visa, Mastercard and Paypal, which were previously included in the data processing & outsourced services sub-industry, under the software & services industry group and the information technology sector.

The change reflects both the increasing role these companies play in facilitating payments across various platforms and markets, and the fact that these activities are closely aligned with the business activities covered under the financial services industry group. However, this change only took effect on 17 March 2023, two years after the first consultation on the subject started.1

Text-based stock clustering (TBSC) is an interesting alternative to GICS. It uses NLP techniques to analyze textual data from various sources, such as 10-K reports. TBSC has several advantages over GICS:

  • TBSC can be more adaptive and flexible because it can update its classifications more frequently based on new information.

  • TBSC can be more granular and accurate because it can capture the similarities and differences among companies within or across sectors based on their specific products or services.

  • TBSC can be more informative and insightful because it provides explanations for its classifications based on textual evidence.

Inversión cuantitativa de próxima generación

A medida que avanza la tecnología, aumentan las oportunidades para los inversores cuantitativos. Con la incorporación de nuevos datos y el aprovechamiento de técnicas de modelización avanzadas podemos ahondar en nuestro conocimiento y mejorar la toma de decisiones.

To illustrate these advantages, Figure 1 shows a 2D projection of company-specific vector embeddings derived from 10-K filings using the bidirectional encoder representations from transformers (BERT) model. We use 10-K reports for the fiscal year 2021 as input for the model to test whether the NLP technique could already anticipate the current GICS revisions.

The results show that the transaction and payment processing services companies – such as Visa, Mastercard and Paypal (light blue) – are indeed closer to their new industry group financial services (green) than their previous industry group software and services (brown). This finding suggests that TBSC can anticipate changes in GICS before they are officially implemented. However, we also find that the financial services industry group is rather heterogeneous compared to other industry groups such as banks, insurance, or semiconductors & semiconductor equipment.

Figure 1 | 2D projection of word embeddings based on 10-K filings for the fiscal year 2021.

Figure  1  |  2D projection of word embeddings based on 10-K filings for the fiscal year 2021.

Source: SEC, Refinitiv, Robeco. The figure shows a 2D projection of numerical embeddings derived from BERT based on firms’ 10-K filings for the fiscal year 2021. The analysis is restricted to MSCI USA Index constituents augmented with large and liquid constituents of the FTSE World Developed and S&P Broad Market Index. The different colors indicate different GICS industry groups within the Information Technology (Software & Services, Technology Hardware & Equipment, and Semiconductors & Semiconductor Equipment) and Financials (Banks, Financial Services, and Insurance) sectors. Furthermore, the stocks from the newly created Transaction and Payment Processing Services sub-industry under the Financial Services industry group are highlighted. Previously, these stocks were included in the Software & Services industry group.

In conclusion, TBSC might be a better and more timely alternative to standard sector or industry classifications, such as GICS. By using NLP techniques to analyze textual data from various sources, TBSC can provide more adaptive, granular, accurate, informative and insightful classifications for stock analysis.


1 For example, the consultation of potential changes already started in 2021, were announced in March 2022, but only become effective in March 2023.

Mantengamos la conversación

Manténgase al día de los constantes cambios en inversión sostenible y factorial, tendencias y crédito.

No se lo pierda

El objetivo de Robeco es proporcionar a sus clientes unos rendimientos y soluciones de inversión superiores para que consigan sus objetivos financieros y de sostenibilidad.

Información importante
Los Fondos Robeco Capital Growth no han sido inscritos conforme a la Ley de sociedades de inversión de Estados Unidos (United States Investment Company Act) de 1940, en su versión en vigor, ni conforme a la Ley de valores de Estados Unidos (United States Securities Act) de 1933, en su versión en vigor. Ninguna de las acciones puede ser ofrecida o vendida, directa o indirectamente, en los Estados Unidos ni a ninguna Persona estadounidense en el sentido de la Regulation S promulgada en virtud de la Ley de Valores de 1933, en su versión en vigor (en lo sucesivo, la “Ley de Valores”)). Asimismo, Robeco Institutional Asset Management B.V. (Robeco) no presta servicios de asesoramiento de inversión, ni da a entender que puede ofrecer este tipo de servicios, en los Estados Unidos ni a ninguna Persona estadounidense (en el sentido de la Regulation S promulgada en virtud de la Ley de Valores). Este sitio Web está únicamente destinado a su uso por Personas no estadounidenses fuera de Estados Unidos (en el sentido de la Regulation S promulgada en virtud de la Ley de Valores) que sean inversores profesionales o fiduciarios profesionales que representen a dichos inversores que no sean Personas estadounidenses. Al hacer clic en el botón “Acepto” que se encuentra en el aviso sobre descargo de responsabilidad de nuestro sitio Web y acceder a la información que se encuentra en dicho sitio, incluidos sus subdominios, usted confirma y acepta lo siguiente: (i) que ha leído, comprendido y aceptado el presente aviso legal, (ii) que se ha informado de las restricciones legales aplicables y que, al acceder a la información contenida en este sitio Web, manifiesta que no infringe, ni provocará que Robeco o alguna de sus entidades o emisores vinculados infrinjan, ninguna ley aplicable, por lo que usted está legalmente autorizado a acceder a dicha información, en su propio nombre y en representación de sus clientes de asesoramiento de inversión, en su caso, (iii) que usted comprende y acepta que determinada información contenida en el presente documento se refiere a valores que no han sido inscritos en virtud de la Ley de Valores, y que solo pueden venderse u ofrecerse fuera de Estados Unidos y únicamente por cuenta o en beneficio de Personas no estadounidenses (en el sentido de la Regulation S promulgada en virtud de la Ley de Valores), (iv) que usted es, o actúa como asesor de inversión discrecional en representación de, una Persona no estadounidense (en el sentido de la Regulation S promulgada en virtud de la Ley de Valores) situada fuera de los Estados Unidos y (v) que usted es, o actúa como asesor de inversión discrecional en representación de, un inversión profesional no minorista.

El acceso a este sitio Web ha sido limitado, de manera que no constituya intento de venta dirigida (según se define este concepto en la Regulation S promulgada en virtud de la Ley de Valores) en Estados Unidos, y que no pueda entenderse que a través del mismo Robeco dé a entender al público estadounidense en general que ofrece servicios de asesoramiento de inversión. Nada de lo aquí señalado constituye una oferta de venta de valores o la promoción de una oferta de compra de valores en ninguna jurisdicción. Nos reservamos el derecho a denegar acceso a cualquier visitante, incluidos, a título únicamente ilustrativo, aquellos visitantes con direcciones IP ubicadas en Estados Unidos. Este sitio Web ha sido cuidadosamente elaborado por Robeco. La información de esta publicación proviene de fuentes que son consideradas fiables. Robeco no es responsable de la exactitud o de la exhaustividad de los hechos, opiniones, expectativas y resultados referidos en la misma. Aunque en la elaboración de este sitio Web se ha extremado la precaución, no aceptamos responsabilidad alguna por los daños de ningún tipo que se deriven de una información incorrecta o incompleta. El presente sitio Web podrá sufrir cambios sin previo aviso. El valor de las inversiones puede fluctuar. Rendimientos anteriores no son garantía de resultados futuros. Si la divisa en que se expresa el rendimiento pasado difiere de la divisa del país en que usted reside, tenga en cuenta que el rendimiento mostrado podría aumentar o disminuir al convertirlo a su divisa local debido a las fluctuaciones de los tipos de cambio. Para inversores profesionales únicamente. Prohibida su comunicación al público en general.