31 de julio de 2022 0 477

Elaboración de Contenidos Automatizados con Fines de SEO: Posibilidades y Dificultades de GPT-3

Desde el surgimiento de GPT-3, se han multiplicado los casos de utilización de los generadores en materia de SEO.  A finales de 2022, el enorme círculo de modelos lingüísticos aumentó considerablemente.

Todos han tratado de exhibir sus técnicas y darlas a entender a los usuarios a partir de trabajos realizados y manifestaciones de carácter público o privado.

Los principales candidatos a la competición se presentan a continuación:

  • EEUU: OpenAI — Turing NLG.
  • República Popular de China: Wu Dao 2.0 - PanGu-Alpha.
  • República de Corea: HyperCLOVA.
  • Israel: A121 (Jurassic-1).
  • Europa: Aleph Alpha.
  • Código abierto: EleutherAI.

Todos los modelos muestran sus ventajas y desventajas.

Para comprobarlo, numerosos editores de software de SEO o agencias de SEO prueban dichos sistemas

¿Cómo Escoger un Modelo GPT-3?

Puede pensar que cuanto más parámetros tenga el modelo, mejor será. Sin embargo, te equivocas.

En realidad, el principal factor a tener para elegir un buen sistema no es la cantidad de variables, ya que con modelos más livianos se consiguen grandes resultados.

Efectivamente, para ser efectivo, es necesario la capacidad de entender un gran número de dominios distintos.

Se trata, en principio, de saber cuál ha resultado ser el modelo entrenado. En lo que respecta a GPT-3, el diagrama siguiente resulta de ayuda:

Captura de pantalla de GPT-3, octubre de 2021

  • Material de archivo web entre 2016 y 2019.
  • Sitio web Text, correspondiente a la obtención de datos en la web.
  • Wikipedia.
  • Books en inglés (Books1).
  • Obras en otros idiomas (Books2).

En cambio, si observamos cómo fueron formados los componentes de los modelos de código abierto, observamos que los orígenes son bastante distintos.

Todos los modelos se apoyan en el proyecto The Pile, consistente en una base de datos con 825 GB de diversos textos en lengua inglesa de acceso público y gratuito.

Con The Pile, hallamos datos de muy diversa índole, por ejemplo, volúmenes, repositorios de GitHub, sitios web, diarios de debate, notas de medicina, ciencias físicas, estadísticas, informática y filosofía.

Trampas a la Hora de Generar Contenidos SEO GPT-3

Si desea crear textos de gran calidad e interés desde el punto de vista de los usuarios, conviene saber las trampas que debe esquivar.

Para empezar, cualquiera que sean los resultados del análisis, hay que darle como input muestras de buena calidad con el fin de que las imite y, principalmente, respeten un determinado texto.

Si le pedimos a nuestro primer modelo lingüístico un contenido acerca de los "fontaneros de la ciudad de Barcelona", podemos ver que este modelo se inclina por diferentes caminos, afortunadamente inadecuados:

  • ¿Debería crearse un repertorio inventado?
  • ¿Debería crear un texto sobre un fontanero catalán?
  • ¿Conviene crear una conversación de fontaneros en París?
  • ¿Tal vez un verso sobre la fontanería en Barcelona?

En pocas palabras, el concepto de modelo se perderá.

La segunda es que los propios modelos de lenguaje no manejan del mismo modo el contenido duplicado.

Así pues, con independencia del contenido que generemos, deberemos recurrir a una nueva herramienta para verificar que el texto no se ha copiado y, más específicamente, para comprobar que dicho texto no ha existido ya y resulta exclusivo.

Existen numerosas aplicaciones para comprobar si el texto es original. En caso contrario, simplemente vuelva a crear el nuevo contenido.

Por otra parte, los patrones de creación de contenidos no permiten optimizar el contenido para la búsqueda en su conjunto.

Nuevamente, están formadas en una amplia gama de fuentes, de modo que deberá orientarlas con todos los instrumentos de semántica existentes.

Además, es posible solicitarles que enfaticen las keywords y que detallen sus contenidos.

Finalmente, el ministro puede inventarse los datos. Efectivamente, los propios mecanismos de los modelos disponen de un ambiente de trabajo creativo.

Cuando el modelo está preparado para admitir una alta dosis de creatividad, a menudo se inventan rasgos para un determinado objeto, que pueden generar inconsistencias en los documentos.

Ejemplos Prácticos de Generación de Contenidos para el SEO

En los últimos 8 meses, se han realizado numerosas y variadas pruebas de uso de los contenidos para SEO.

Utilizando modelos gratuitos del tipo GPT-Neo y GPT-J, se han obtenido resultados muy buenos en las siguientes áreas de trabajo:

  • Obtención de ideas ( de lugares, personas, etc.).
  • Extracción a partir de un escrito de preguntas.
  • Obtención de resultados de preguntas a través de un texto.
  • Utilización de textos breves en inglés para la creación de títulos o meta descripciones.

Con un modelo pagado como el GPT-3, de precio económico, se han podido crear no sólo unos textos extensos y concretos, es decir, unos sofisticados sumarios textuales.

No es fácil interpretar la figura, pero en ella se pueden ver ejemplos de introducción de información en negrita y, a partir de ahí, los textos creados por el programa, en cursiva.

El objetivo consiste en elaborar un mensaje que incentive a la compra de un determinado producto.

GPT-3 comprende exactamente el tipo y la extensión del texto requerido e incorpora las herramientas a utilizar: se genera el texto completo en cuestión de menos de 10 segundos.

Texto generado:


Dos Innovaciones para el SEO

Previamente, es posible que el GPT-3 no pudiera crear contenidos dirigidos al público destinatario debido a su falta de formación, como vimos con anterioridad.

En la actualidad, es posible volver a adiestrar el modelo.

Simplemente facilite de 20 a 100 ejemplares que tengan sus indicaciones a modo de entrada y la finalización de la espiritualidad que desea que generen a la salida:

El proceso requiere mucho esfuerzo, pero después tienes un patrón óptimo que se ajusta perfectamente a tu situación, sobre todo si tienes que usar un determinado vocabulario para algún nicho, industria o asunto en concreto a la hora de mejorar tu SEO.

Esto requiere sólo un par de líneas del código Python. La parte más lenta es la creación de este fichero de referencia.

Finalmente, vamos al único tema que nos entusiasma bastante esta vez: ¡la creación de código!

Efectivamente, se ha estrenado una técnica en la que nosotros proporcionamos órdenes y el nuevo buscador de OpenAI Codex puede generar un código Python para solucionar nuestros propios problemas.

Comencemos por precisar que esos son simples males: no puede reemplazar a los constructores puesto que habría que proveer a la IA con todo el código parametrizado, al igual que todas las limitaciones tecnológicas.

A continuación, un mini-ejemplo en el que se obtiene el fichero de registro de la NASA correspondiente a la fecha del 01 de agosto de 1995 y se pide un diagrama de barras con el número total del URL visitado durante esa hora.


Conclusión

Los modelos de lenguaje en SEO sólo están limitados por las posibilidades que ofrecen los clientes. Seguramente se pueda elaborar un panel de mando completo de SEO de esta forma, dividiendo cada punto de vista deseado, un camino a la vez.

En las tiendas web, los modelos lingüísticos aún depara numerosas sorpresas e incluso nuevos usos para el marketing.

¿Qué te parece el artículo?