Portafolio

Portafolio de proyectos de NLP


Project maintained by XiomyDiazAnalyst Hosted on GitHub Pages — Theme by mattgraham

Portafolio NLP

Image

Mi nombre es Xiomy Díaz, soy profesional en Mercadeo y Publicidad, mi marca de consultoría es Market In-Sight, me apasionan los datos y el entendimiento de los clientes y tendencias a través de los mismos.

Proyectos

  1. Adqusición de Textos
    • Leer archivos con Python
    • Contar palabras de un texto con countWord de la librería re
    • Web Scraping a páginas de wikipedia usando urllib.request y bs4
  2. Extracción, pre-procesamiento y normalización de textos
    • Pre-procesamiento de texto en NLP, pasar texto a minúsculas, quitar caractéres, tokenización, quitar palabras vacías y stemming. -Usando stopwords, SnowballStemmer, Counter, es_core_news_sm
  3. Representación vectorial de textos
    • Feature Engineering
    • Bolsa de palabras (BoW)
  4. Vectorización con TF-IDF
    • Matriz TF-IDF usando TfidfVectorizer
    • Medida de similitud usando la distancia del coseno usando cosine_distances
    • Gráfico de calor con matplotlib
  5. Vectorización con Word2Vec
    • Pre-procesamiento del texto
    • Uso de Word2Vec
    • Mostrar las palabras más parecidas con most_similar
    • Visualizar el modelo usando PCA
  6. Clasificación y agrupación de Textos
    • Modelos de Clasificación MultinomialNB, LogisticRegression y LinearSVC para asignar una categoría de producto de acuerdo al texto de las reseñas de los productos.
    • Agrupación de textos con KMeans, aplicando el método del codo
  7. Modelado de temas
    • Modelo de LDA (LdaModel)
    • Visualización de LDA
  8. Wordcloud
    • Como crear una nube de palabras en Python
  9. Twitter y NLP
    • Extraer tweets usando la API de twitter
    • Visualización de emojis usando Plotly
  10. Análisis de sentimiento
    • Extraer tweets usando la API de twitter y analizar si son positivos o negativos con la librería Flair
    • Visualización de nubes de palabras
  11. Proyecto de NLP
    • Para entender la caída en post link clics de una cuenta de radio de Facebook en julio vs junio, luego de que Facebook implementara un algortimo para castigar el clickbait, se analizó el nivel de subjetividad de las publicaciones, y también se aplicó LDA con pyLDAvis, y con GSDMM, obteniendo mejores resultados con éste último al ser el adecuado para textos cortos y se identificó que la caída en los resultados se debe al contenido de los posts.

Si quieres conocer más sobre mi trabajo puedes visitar: