关于SO的第一个问题,但我已经潜伏了很长时间,所以如果我违反任何规则或发布垃圾问题,你将不得不原谅我. 我正在努力更好地理解线程,我决定测试MRI,看看它的表现如何. 给定以下代码
我正在努力更好地理解线程,我决定测试MRI,看看它的表现如何.
给定以下代码(和输出),为什么线程操作比非线程变体慢得多?
码
class Benchmarker def self.go puts '----------Benchmark Start----------' start_t = Time.now yield end_t = Time.now puts "Operation Took: #{end_t - start_t} seconds" puts '----------Benchmark End------------' end end # using mutex puts 'Benchmark 1 (threaded, mutex):' Benchmarker.go do array = [] mutex = Mutex.new 5000.times.map do Thread.new do mutex.synchronize do 1000.times do array << nil end end end end.each(&:join) puts array.size end # using threads puts 'Benchmark 2 (threaded, no mutex):' Benchmarker.go do array = [] 5000.times.map do Thread.new do 1000.times do array << nil end end end.each(&:join) puts array.size end # no threads puts 'Benchmark 3 (no threads):' Benchmarker.go do array = [] 5000.times.map do 1000.times do array << nil end end puts array.size end
输出
Benchmark 1 (threaded, mutex): ----------Benchmark Start---------- 5000000 Operation Took: 3.373886 seconds ----------Benchmark End------------ Benchmark 2 (threaded, no mutex): ----------Benchmark Start---------- 5000000 Operation Took: 5.040501 seconds ----------Benchmark End------------ Benchmark 3 (no threads): ----------Benchmark Start---------- 5000000 Operation Took: 0.454665 seconds ----------Benchmark End------------
提前致谢.
一旦达到大量线程(5000),调度程序在线程之间切换的开销远远超过每个线程实际执行的工作量.通常,您最多需要30-50个线程.尝试降低线程数量并按比例增加每个线程的工作量:
20.times.map do Thread.new do 250000.times do array << nil end end end.each(&:join)
你应该看到更多可比较的结果.
注意,您可能会看到下限时间(线程)> =时间(非线程) – 这是Threaded版本的时间不能低于单线程版本.这是因为MRI的GIL一次只允许一个线程执行(它们永远不能并行运行).一些ruby实现(如JRuby)允许并行执行线程.