bi()

阅读(1371) 标签: bi,

本章介绍bi()函数的多种用法。

A.bi ()

描述:

建模时,将分类数不高于6的低频分类枚举变量,拆分为多个二值变量。

语法:

A.bi()

建模时,将分类数不高于6的低频分类枚举变量A,拆分为多个二值变量。返回结果为处理结果序表和处理记录Rec构成的二值序列。

A.bi@r(Rec)

预测时,根据处理记录序列Rec,将分类数不高于6的低频分类枚举变量A,拆分为多个二值变量,返回结果构成序表。

备注:

外部库函数,外部库的使用请参考《外部库使用指南》。

建模时,将分类数不高于6的低频分类枚举变量,拆分为多个二值变量。

参数:

A

 序列,分类数不高于6的低频分类枚举变量。

Rec

处理结果记录序列。

返回值:

序列/序表

示例:

 

A

 

1

=T("D://house_prices_train.csv")

 

2

=A1.(MSZoning)

分类数不高于6的变量

3

=A2.bi()

A3(1)拆分结果序表。

A3(2)拆分记录Rec

4

=A2.bi@r(A3(2))

根据A3的处理记录Rec,将A2拆分为多个变量:

 

P.bi ()

描述:

外部库函数,外部库的使用请参考《外部库使用指南》。

建模时,将分类数不高于6的低频分类枚举变量,拆分为多个二值变量。

语法:

P.bi(cn)

建模时,将分类数不高于6的低频分类枚举变量cn,拆分为多个二值变量。返回结果为处理结果序表和处理记录Rec构成的二值序列。

P.bi@r(cn, Rec)

预测时,根据处理记录序列Rec,将分类数不高于6的低频分类枚举变量cn,拆分为多个二值变量,返回结果构成序表。

参数:

P

序表/排列。

cn

字符串/数字,序表或排列中准备预处理变量的列名(或列号,从1开始)。

Rec

处理结果记录序列。

返回值:

序列/序表

示例:

 

A

 

1

=T("D://house_prices_train.csv")

 

2

=A1.bi("MSZoning")

MSZoning拆分成多个二值变量,

A2(1)拆分结果;

A2(2)拆分记录Rec

3

=A1.bi@r("MSZoning",A2(2))

根据A2的拆分记录对变量进行拆分。