机器学习之简单线性回归

发表于2022-11-15|更新于2022-11-16|学习

|浏览量:

方程

y = b₀ + b₁*X₁

简单线性回归其实就是一个一元一次方程，在图像上呈现一个线性关系。

如何拟合这样一条线？

拟合的原理其实很简单，就是找到一条线，使得所有的点离这条线的距离之和是所有可能中最小的情况。当这条线满足这个要求的时候，这条线就是我们方程拟合的目标结果。
我们将用这样的结果去预测与之类似的数据，查看预测效果。

数据集

YearsExperience	Salary
1.1	39343.00
1.3	46205.00
1.5	37731.00
2.0	43525.00
2.2	39891.00
2.9	56642.00
3.0	60150.00
3.2	54445.00
3.2	64445.00
3.7	57189.00
3.9	63218.00
4.0	55794.00
4.0	56957.00
4.1	57081.00
4.5	61111.00
4.9	67938.00
5.1	66029.00
5.3	83088.00
5.9	81363.00
6.0	93940.00
6.8	91738.00
7.1	98273.00
7.9	101302.00
8.2	113812.00
8.7	109431.00
9.0	105582.00
9.5	116969.00
9.6	112635.00
10.3	122391.00
10.5	121872.00

数据读取

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd 

dataset = pd.read_csv("Salary_Data.csv")
X = dataset.iloc[:,:1].values
Y = dataset.iloc[:,-1].values

划分测试集与训练集

1 2	from sklearn.model_selection import train_test_split X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size = 0.2,random_state = 0)

关于特征缩放

在简单线性回归的函数中已经包含了特缩放的操作，我们不再需要再对其做出特征缩放了

简单线性回归

1
2
3

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train,Y_train)

测试预测结果

1	y_pred = regressor.predict(X_test)

图像展示

预测结果展示

plt.scatter(X_train,Y_train,color = "red")
plt.plot(X_train,regressor.predict(X_train),color = "blue")
plt.title("Salary VS Experience (training set)")
plt.xlabel("Years of Experience")
plt.ylabel("Salary")
plt.show()

预测结果

测试结果展示

plt.scatter(X_test,Y_test,color = "red")
plt.plot(X_train,regressor.predict(X_train),color = "blue")
plt.title("Salary VS Experience (training set)")
plt.xlabel("Years of Experience")
plt.ylabel("Salary")
plt.show()

测试结果

文章作者: 望

文章链接: https://m42-orion.github.io/2022/11/15/%E7%AE%97%E6%B3%95-%E7%AE%80%E5%8D%95%E7%BA%BF%E6%80%A7%E5%9B%9E%E5%BD%92/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源念念不忘，必有回响！

python 机器学习简单线性回归

相关推荐

RAG-什么是chunking

什么是 Chunking？在自然语言处理（NLP）和文本分析领域，Chunking（分块）是一种将文本分割成有意义的、可管理的片段的技术。这些片段通常被称为“块”（chunks），可以是短语、句子、段落或其他有意义的语言单元。Chunking 的目标是从文本中提取出结构化的信息，以便更好地理解和处理语言数据。 Chunking 的基本概念Chunking 的核心思想是将连续的文本分割成更小的、有意义的单元。与简单的分词（tokenization）不同，Chunking 不仅仅是把文本拆分成单词，而是将这些单词组合成更大的语义单元。例如，在句子“The quick brown fox jumps over the lazy dog”中，Chunking 可能会将“The quick brown fox”识别为一个名词短语（NP），而“jumps over the lazy dog”识别为一个动词短语（VP）。 Chunking 的应用场景信息提取：Chunking 可以帮助从文本中提取出关键信息，如人名、地名、日期、组织机构等。例如，在新闻文章中，Chunking...

RAG-python库Chonkie的使用

使用 Python 库 Chonkie 快速上手在自然语言处理（NLP）领域，文本分块（chunking）是一种常见的任务，它将长文本分割成更小的块，以便于后续处理和分析。无论是构建 RAG（Retrieve-Augment-Generate）模型，还是进行大规模文本处理，分块都是一项基础且关键的步骤。然而，现有的许多分块工具要么功能过于复杂，要么过于简陋，难以满足开发者的实际需求。幸运的是，现在有了 Chonkie —— 一个简单易用的 Python 库，它专注于提供高效且灵活的文本分块解决方案。本文将详细介绍如何使用 Chonkie 快速上手文本分块，并通过几个实际示例展示其强大的功能。什么是 Chonkie？Chonkie 是一个轻量级的 Python 库，旨在简化文本分块的过程。它提供了多种分块策略，包括基于句子的分块、递归分块、语义分块和双通道合并分块等，能够满足不同场景下的需求。Chonkie 的设计目标是简单、高效且易于扩展，让开发者能够专注于核心业务逻辑，而不是被复杂的分块逻辑所困扰。安装 Chonkie在开始之前，您需要先安装...

anaconda与python

是什么Python是一种广泛使用的编程语言，它以其简洁的语法和强大的库支持而闻名。然而，Python在科学计算和数据分析领域中的使用受到了一些限制。为了解决这个问题，Anaconda应运而生，它是一个用于科学计算的Python发行版，它包含了Python解释器、大量的科学计算库和工具，以及一个包管理器conda。 Python与Anaconda的关系Python与Anaconda之间的关系非常密切。Anaconda是一个基于Python的发行版，它包含了Python解释器、大量的科学计算库和工具，以及一个包管理器conda。因此，Python是Anaconda的基础，而Anaconda则提供了Python在科学计算和数据分析领域中的强大支持。 Python与Anaconda的区别Python与Anaconda在安装源、安装方式、环境管理和包管理方面有一些区别。Python的官方源是Python Package Index (PyPI)，而Anaconda的官方源是Anaconda Repository。PyPI上的包可能不是官方版本，而Anaconda...

conda与pip的区别conda install 和 pip install 是两种常用的Python包管理工具,它们都可以用来安装和管理Python库。但是,它们在安装源和安装方式上有一些区别。安装源 conda install 使用的是Anaconda的官方源,而pip install 可以指定任意源来安装库。因此,conda install 安装的库通常都是官方版本的库,而pip install 安装的库可能是官方版本的库,也可能是其他版本的库。安装方式 conda install 使用的是Anaconda的包管理器,它会在安装库时自动处理依赖关系,并将其安装到Anaconda的虚拟环境中。因此,使用conda install 安装的库都是独立的,不会影响系统中的其他Python库。而pip install 安装的库则是直接安装到系统Python的site-packages目录中,可能会与其他库发生冲突。影响或问题 (1) 版本冲突由于pip install...

hello world12345678910#FileName: HelloWorld.java public class HelloWorld #如果有 public 类的话，类名必须和文件同名，注意大小写 { #Java 入口程序，程序从此入口 public static void main(String[] args) { #向控制台打印一条语句 System.out.println("Hello,World!"); } } 123456#include <stdio.h> int main() #main 入口函数 { printf("Hello,World!"); #printf 函数打印 return 1; #函数返回值 } 1234567891011#include <iostream> ...

python代码加密

之前工作中需要使用到对python代码进行加密，因为许多核心代码设计到重要信息，不能暴露给客户。但是python作为一种脚本语言，既要保证运行部署方便又要考虑到代码破译的安全性问题。编译加密编译加密就是常见的将python代码编译成为以后缀.pyc的文件，虽然不影响使用与部署，但是可以被反编译，直接使用uncompyle库进行反编译即可得到结果代码混淆代码混淆在我之前的记录当中提起过，网站优点：简单不可逆不影响逻辑缺点：对于项目来说不友好混淆不可控逻辑依然可读打包成exe文件python可以使用pyinstaller将文件打包成exe文件，但是对于项目部署来说几乎全是缺点：内部路径找不到资源文件不好打包部署使用麻烦难以控制生成使用 Cython它的原理：将 .py/.pyx 编译为 .c文件，再将 .c文件编译为 .so(Unix) 或 .pyd(Windows) 1pip install...