PySpark-MLib

در این آموزش یک دیتا ست ساده را با اسپارک میخوانیم و الگوریتم ماشین لرنینگ رگرسیون را روی آن اجرا میکنیم.

چند دستور زیر الزامی و برای ایجاد محیط هستند:

pip install pyspark
from pyspark.sql import SparkSession
spark=SparkSession.builder.appName('MLib').getOrCreate()

خواندن دیتا:

## Read The dataset
training = spark.read.csv('test1_data.csv',header=True,inferSchema=True)

ادامه از فایل گیتهاب خودم

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.