‹›Расширенный перечень операций по статистике и теории вероятностейУлучшенная бинаризация данных
Сравним скорость бинаризации данных. Следующие графики показывают затраты времени для бинаризации различных размеров выборок с различными критериями бинаризации. Эксперименты проводились на основе системы Windows 10 с процессором Intel Xeon E3-1245 v2 3,40 ГГц. Приведенное ниже численное выражение показывает, насколько быстрее версия 11 выполняет данные операции по сравнению с версией 10.
Следующим образом проводится одномерная неоднородная бинаризация.
код на языке Wolfram Language целиком
SeedRandom[1];
rlist = Sort[RandomReal[1, 100]];
Table[
BlockRandom[SeedRandom["MarketingExample"];
data = RandomReal[1, n]];
Mean[Table[First[AbsoluteTiming[BinCounts[data, {rlist}];]], {5}]]
, {n, {100, 10000, 1000000}}]
Следующим образом проводится двумерная неоднородная бинаризация.
код на языке Wolfram Language целиком
SeedRandom[1];
rlist1 = Sort[RandomReal[1, 100]];
rlist2 = Sort[RandomReal[1, 100]];
Table[
BlockRandom[SeedRandom["MarketingExample"];
data = RandomReal[1, {n, 2}]];
Mean[Table[
First[AbsoluteTiming[BinCounts[data, {rlist1}, {rlist2}];]], {5}]]
, {n, {100, 10000, 1000000}}]
Следующим образом проводится одномерная однородная бинаризация.
код на языке Wolfram Language целиком
Table[
BlockRandom[SeedRandom["MarketingExample"];
data = RandomReal[1, n]];
Mean[Table[First[AbsoluteTiming[BinCounts[data, {0, 1, 0.1}];]], {5}]]
, {n, {10000, 100000, 1000000}}]
Следующим образом проводится двумерная однородная бинаризация.
код на языке Wolfram Language целиком
Table[
BlockRandom[SeedRandom["MarketingExample"];
data = RandomReal[1, {n, 2}]];
Mean[Table[
First[AbsoluteTiming[
BinCounts[data, {0, 1, 0.1}, {0, 1, 0.1}];]], {5}]]
, {n, {10000, 100000, 1000000}}]