//---------------------------------------------------------------------------// // Copyright (c) 2015 Jakub Szuppe // // Distributed under the Boost Software License, Version 1.0 // See accompanying file LICENSE_1_0.txt or copy at // http://www.boost.org/LICENSE_1_0.txt // // See http://boostorg.github.com/compute for more information. //---------------------------------------------------------------------------// #ifndef BOOST_COMPUTE_ALGORITHM_DETAIL_REDUCE_BY_KEY_HPP #define BOOST_COMPUTE_ALGORITHM_DETAIL_REDUCE_BY_KEY_HPP #include #include #include #include #include #include #include #include #include namespace boost { namespace compute { namespace detail { template size_t reduce_by_key_on_gpu(InputKeyIterator keys_first, InputKeyIterator keys_last, InputValueIterator values_first, OutputKeyIterator keys_result, OutputValueIterator values_result, BinaryFunction function, BinaryPredicate predicate, command_queue &queue) { return detail::reduce_by_key_with_scan(keys_first, keys_last, values_first, keys_result, values_result, function, predicate, queue); } template bool reduce_by_key_on_gpu_requirements_met(InputKeyIterator keys_first, InputValueIterator values_first, OutputKeyIterator keys_result, OutputValueIterator values_result, const size_t count, command_queue &queue) { const device &device = queue.get_device(); return (count > 256) && !(device.type() & device::cpu) && reduce_by_key_with_scan_requirements_met(keys_first, values_first, keys_result,values_result, count, queue); return true; } template inline std::pair dispatch_reduce_by_key(InputKeyIterator keys_first, InputKeyIterator keys_last, InputValueIterator values_first, OutputKeyIterator keys_result, OutputValueIterator values_result, BinaryFunction function, BinaryPredicate predicate, command_queue &queue) { typedef typename std::iterator_traits::difference_type key_difference_type; typedef typename std::iterator_traits::difference_type value_difference_type; const size_t count = detail::iterator_range_size(keys_first, keys_last); if (count < 2) { boost::compute::copy_n(keys_first, count, keys_result, queue); boost::compute::copy_n(values_first, count, values_result, queue); return std::make_pair( keys_result + static_cast(count), values_result + static_cast(count) ); } size_t result_size = 0; if(reduce_by_key_on_gpu_requirements_met(keys_first, values_first, keys_result, values_result, count, queue)){ result_size = detail::reduce_by_key_on_gpu(keys_first, keys_last, values_first, keys_result, values_result, function, predicate, queue); } else { result_size = detail::serial_reduce_by_key(keys_first, keys_last, values_first, keys_result, values_result, function, predicate, queue); } return std::make_pair( keys_result + static_cast(result_size), values_result + static_cast(result_size) ); } } // end detail namespace } // end compute namespace } // end boost namespace #endif // BOOST_COMPUTE_ALGORITHM_DETAIL_REDUCE_BY_KEY_HPP