در این آموزش یک دیتا ست ساده را با اسپارک میخوانیم و الگوریتم ماشین لرنینگ رگرسیون را روی آن اجرا میکنیم.
چند دستور زیر الزامی و برای ایجاد محیط هستند:
pip install pyspark
from pyspark.sql import SparkSession
spark=SparkSession.builder.appName('MLib').getOrCreate()
خواندن دیتا:
## Read The dataset
training = spark.read.csv('test1_data.csv',header=True,inferSchema=True)
ادامه از فایل گیتهاب خودم