Detaylar
Diğer Eğitimler

Eğitim Hakkında

Text Analytics and Natural Language Processing (NLP) with R eğitimi, katılımcılara metin verilerini keşfetmek ve analiz etmek için R programlamayı nasıl kullanacaklarını öğretir.

Bu ders, düz metin dosyaları, pdf'ler veya web gibi çeşitli kaynaklardan metin verilerini alma ve ardından bu verileri en son doğal dil işleme ve derin öğrenme tekniklerini kullanarak işleme yöntemlerini kapsamlı bir şekilde kapsar.

Neler Öğreneceksiniz

• Metin verilerini çeşitli kaynak biçimlerinden içe aktarmayı,

• Metin verilerini anlamlı birimlere şifrelemeyi,

• Belirli metin işlevlerini kullanarak metin verilerini karıştırmayı,

• Jetonlaştırılmış veriler üzerinde toplama önlemlerini hesaplamayı,

• Metin veri formatları arasında çeviri yapmayı,

• Belge sınıflandırması gerçekleştirmeyi,

• Konu modelleme gerçekleştirmeyi,

• NLP modellemeye uygun basit bir sinir ağı oluşturmayı.

Eğitim İçeriği

Yapılandırılmamış metin verileriyle çalışma
dize yöntemleri
normal ifade
metin dosyalarında okuma
baz incelemesi (R / Python)

İçe aktarma
bir metin dosyasındaki verileri ayrıştırma
onu düzenli bir yapıya aktarmak
bir pdf'den verileri ayrıştırma
Bir "pdf yığınından"
web'den veri almak
Diğer yöntemlerin tartışılması
OCR
Elyazısı tanıma

Metin Verilerini Yönetme 1
düzenli bir metin biçimi
Metin veri formatlarına genel bakış
düzenli metin
simge listesi
belge terim matrisi veya belge frekans matrisi (dfm / dt)
docvars

ilişkili formatlar
kelimeleri durdur
lexica
kelime vektörleri / modelleri

Metin Verilerini Yönetme 2
metin belirtme
Lemma
n-gram
cümleler
Tweetler
Tf-idf
Günlük oranlar (tidylo)

Text Analizi
Text lexica
İnner_join ile duygu analizi
Diğer birimler tarafından analiz
Değer değişimi
VADER
Belge Sınıflandırması
Metin benzerliği - stringiest
Kosinüs
Mesafeyi düzenle
Belge sınıflandırması için Makine Öğrenimi
Bayes modeli

Konu Modelleme / Belge Kümeleme
LDA
stm

Metin ve Derin Öğrenme
Derin öğrenmeye giriş

Tensorflow + keras

Kelime vektörleri
word2vec
Text2vec
Eldiven
Spacy

Derin Öğrenme ve NLP'yi Birleştirme
CNN
RNN
LSTM

Adlandırılmış Varlık Tanıma (NER)
Konuşma etiketlemesinin (POS) parçası
Bağımlılık Ayrıştırma

Diğer Eğitimler

Digital Vizyon
444 Eğitim Seti
Eğitimlere Dön