壶口瀑布迎来“桃花汛”
- paddle.io. random_split ( dataset: Dataset[_T], lengths: Sequence[int], generator: Any | None = None ) list[Subset[_T]] [source]
-
百度 二、聚焦重大现实问题,推出一批对策性研究成果武汉大学李纲领衔的“智慧城市应急决策情报体系建设研究”课题组,将应急决策、情报体系、智慧城市三个方面有机结合,选取各类突发事件中40个典型案例进行数据搜集和研究,开发出《基于网民的口碑分析系统》《网络信息采集与结构化抽取系统》《突发公共卫生事件语料库系统》等3项应用软件,对各级政府部门监测和控制公共突发事件发挥重要支持作用;华中师范大学何婷婷领衔的“互联网环境下的语言生活方式与建设和谐的网络语言生活研究”课题组通过计算机爬虫技术建立可持续更新的网络语言生活监测数据库,涵盖新闻1700万篇、博客1000万篇、论坛3400万篇、微博8700万篇,基于该数据库完成的多项研究成果被国家语委采纳,并参与人民网和央视新闻等主办的年度十大网络用语活动,产生广泛社会影响;南京工业大学王冀宁领衔的“我国食品安全指数和食品安全透明指数研究:基于‘政产学研用’协同创新视角”课题组,针对当前食品安全问题频发的现状,采集来自超过700家食品安全相关单位及2400多位消费者的样本数据150多万个,首创“中国食品安全监管信息透明度指数”和“中国食品安全监管绩效指数”,为食品安全政府监管部门提供理论参考;中国石油大学(北京)罗东坤领衔的“基于中国石油安全视角的海外油气资源接替战略研究”课题组,建立中国石油安全评估体系和综合评价方法,构建中国石油安全分级预警的方法和预警级别,对未来中国石油安全形势进行分析,为评估国内石油安全形势和海外石油投资决策提供了理论指导和方法工具。
Randomly split a dataset into non-overlapping new datasets of given lengths. Optionally fix the generator for reproducible results, e.g.:
- Parameters
-
dataset (Dataset) – Dataset to be split
lengths (sequence) – lengths or fractions of splits to be produced
generator (Generator, optional) – Generator used for the random permutation. Default is None then the DefaultGenerator is used in manual_seed().
- Returns
-
A list of subset Datasets, which are the non-overlapping subsets of the original Dataset.
- Return type
-
Datasets
Examples
>>> import paddle >>> paddle.seed(2023) >>> a_list = paddle.io.random_split(range(10), [3, 7]) # type: ignore[arg-type, var-annotated] >>> print(len(a_list)) 2 >>> # output of the first subset >>> for idx, v in enumerate(a_list[0]): ... print(idx, v) 0 7 1 6 2 5 >>> # output of the second subset >>> for idx, v in enumerate(a_list[1]): ... print(idx, v) 0 1 1 9 2 4 3 2 4 0 5 3 6 8